CSV

Comma Separated Values is een eenvoudig format voor het weergeven van numerieke en tekstuele tabulaire data. Hoewel er verschillende standaarden in omloop zijn en worden gebruikt wordt de strikte vorm beschreven in RFC4180.

In een CSV-bestand worden de aparte waarden/cellen uit een tabel van elkaar gescheiden met een komma als scheidingsteken. De data wordt opgeslagen in platte tekst, waardoor interpretatie van de gegevens niet afhankelijk is van een specifieke applicatie. CSV-bestanden kunnen in database-applicaties worden ingelezen, maar kunnen ook helder en snel als spreadsheet worden geopend, in bijvoorbeeld Microsoft Excel. Ook kunnen deze bestanden als tekstbestanden worden gelezen, bijvoorbeeld in Notepad. Het format wordt veelvuldig gebruikt door statistische programmeertalen als R en als gegevensdrager binnen interactieve computing environments als Jupyter Notebooks.

MsExcel sheets en MsAccess tabellen kunnen, vanuit de applicatie, worden opgeslagen als CSV.

CSV is een handig format voor gegevensuitwisseling. Elke aanvullende informatie die nodig is om de data te kunnen interpreteren moet in een apart document worden geleverd. Dit laatste is vooral van belang als het gaat om preserveren op langere termijn. Een omschrijving van kolommen, een verklaring van de codes en de variabelen gebruikt in de data, het data type gebruikt in verschillende velden en de wijdere context van de gegevens is dan onmisbaar.

Veel applicaties zullen CSV-bestanden zonder problemen kunnen openen. Afhankelijk van de standaardinstellingen op de computer voor het gebruik van scheidingstekens, kan het echter wel voorkomen dat een programma de kolommen niet automatisch van elkaar scheidt. In de applicatie kunnen kolommen nader worden gesplitst op basis van scheidingstekens; eventueel kan de standaardinstelling op de computer worden aangepast. Bij Windows-systemen staat deze standaardinstelling onder ‘Decimaal scheidingsteken’/’List separator’ in het ‘Land en Taal’/‘Region and Language’ configuratiescherm. Als hier een komma als scheidingsteken staat, zullen de CSV-bestanden in alle applicaties correct in gescheiden kolommen worden weergegeven.

CSV is een preferred format voor Spreadsheets en voor Database tabellen.

Lees meer over Spreadsheets.
Lees meer over Databases