DatorerFiltyper

CSV-format, eller var att sätta kommatecken?

Bland ansökningarna, inför om inte en programmerare, är det redan en avancerad användare, importera data från ett program till ett annat inte förekommer mycket sällan. Och ganska ofta är det nödvändigt att importera tabelldata, som i själva verket myntades av CSV-format. Vem utvecklat flera alternativa lösningar (XML ledare bland dem). Men skapandet av CSV-fil, i vissa fall, är den lämpligaste lösningen, och några - den mest problematiska.

Den står för namnet på formatet som en commaseparatedvalues - kommaseparerade värden. I Anteckningar fil på följande sätt:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (vid slutet av ett tecken sätta inte krävs)

Och i ett Excel-ark eller liknande program redan är så:

00 01 02 03
01 15 34 11
16 27 33 06

Men nu har vi diskuterat det enklaste fallet. Problemen börjar bara på grund av det faktum att på grund av mycket komprimerat datarapportering är CSV-format som används för att överföra stora mängder information. Oftast finns i databaserna av olika värden: numeriska, alfa, alfanumeriska, med mellanslag, etc. Ofta i stora matriser är misstag, och om, till exempel, kommer någonstans att vara en extra kommatecken i innehållet i ett av fälten kan alla celler förskjutas med ett.

Generellt uppstår problem när data importeras via filformatet CSV, kan delas in i tre kategorier:

1 - Felaktiga fyllnings fält.

2 - Felaktig datakonvertering när du sparar till CSV-fil.

3 - Felaktig igenkänningsprogram format importör.

Det första fallet har vi delvis undersökt. För att bekämpa problemet, måste du ange ett sätt att övervaka riktigheten av de inmatade data. Till exempel, om du behöver samla en databas med adresser för e-postlistan finns särskilda skript som verifierar om en person har kommit in i e-post i rätt format. Där det finns luckor, kommatecken och andra data som kan läsas fel, innehållet i fältet ska inom citattecken (så kallad dator "").

Det andra fallet är förbunden med valet av kodning. Måste ta reda på är ofta upplevs av vad kodning föredrar importerar program. I Windows vanligen används i 1251, så om den ursprungliga filen kommer att möta texten till Unicode, följ den kommer att visas i målprogrammet som en kedja av frågor. I Excel kan du spara i CSV-format med olika kodning och avgränsare (utom punkt fortfarande används fliken och semikolon), men det är bäst att skapa en fil i Notepad ++ eller OpenOfficeCalc.

Det tredje fallet - en konsekvens av den andra. Historiskt sett har CSV-formatet inte en enda standard. Många program uppfattas som CSV och TSV-fil (tabbavgränsad) och SCSV (separerade med semikolon), i synnerhet på grund av att filändelsen inte redovisas om det. I detta fall läses data felaktigt och inte fördelas mellan cellerna i rätt ordning. Det bästa vi kan ge råd - att skapa en CSV-fil personligen. Som redan nämnts, behöver det att dra nytta av en bekväm redaktör.

Tricks hur man tämja CSV-format, kända programmerare. Enkel användaren behöver följa våra rekommendationer för att skapa en fil. Minst av alla problem uppstår när filen skapats speciellt för import till ett visst program (och ibland på ett annat sätt). Det är lättare att ta hänsyn till alla möjliga problem i data.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sv.atomiyme.com. Theme powered by WordPress.