Bestandsformaten

Preferred formats zijn de bestandsformaten waarvan DANS het vertrouwen heeft dat deze op de langere termijn de beste garanties bieden qua bruikbaarheid, toegankelijkheid en duurzaamheid. Het deponeren van onderzoeksdata in preferred formats zal zonder meer door DANS worden geaccepteerd.

Verder hanteert DANS de categorie ‘non-preferred formats’: bestandsformaten die naast de preferred formats veel worden gebruikt, waar vaak matige tot redelijke scores aan verbonden kunnen worden voor wat betreft de bruikbaarheid, toegankelijkheid en robuustheid op de lange termijn.

Als algemene richtlijn stelt DANS dat de bestandsformaten die het beste geschikt zijn voor duurzaamheid en toegankelijkheid op de lange termijn:

  • Veel worden gebruikt
  • Open specificaties hebben
  • Onafhankelijk zijn van specifieke software, ontwikkelaars of leveranciers

In de praktijk blijkt het niet altijd mogelijk om formaten te gebruiken die voldoen aan al deze kenmerken.

Het kan wenselijk zijn om bepaalde originele data in ‘Non-preferred format(s)’ beschikbaar te stellen omdat deze gekenmerkt kunnen worden als actuele gebruiksformaten. Voorbeelden hiervan zijn Esri Shapefiles, Microsoft Access databases, SPSS .sav bestanden. DANS vraagt u dan om uw data te deponeren in deze originele formaten alsmede in Preferred formats die op de lange termijn-duurzaamheid zijn gericht.

Voor deponeringen van datasets uit de archeologie gelden de bepalingen zoals opgenomen in BRL SIKB 4000.

Indien uw data zijn opgeslagen in andere bestandsformaten dan in onderstaande lijst zijn vermeld, neem dan contact op met DANS.

Type Preferred format(s) Non-preferred format(s)
Tekstdocumenten
Platte tekst
Opmaaktaal
Programmeertaal
Spreadsheets
Databases
Statistische data
Afbeeldingen (raster)
Afbeeldingen (vector)
Audio
Video
Computer Aided Design (CAD)
Geografische Informatie  Systemen (GIS)
Afbeeldingen (georeferentie)
Raster GIS
3D
RDF
  • RDF/XML (.rdf)
  • Trig (.trig)
  • Turtle (.ttl)
  • NTriples (.nt)
  • JSON-LD
Computer Assisted Qualitative Data Analysis (CAQDAS)

Digitale gegevens worden opgeslagen in bestandsformaten. Vaak wordt gebruik gemaakt van standaardformaten van software. Meestal zal de keuze voor de software en daarmee het bestandsformaat afhankelijk zijn van het primaire doel van de gebruiker.

Zo zal bijvoorbeeld voor het maken van een tabel sneller gebruik gemaakt worden van software voor spreadsheets dan een tekstverwerkingsprogramma. Dit komt omdat een datatabel bepaalde eigenschappen vereist, die door de gespecialiseerde software beter worden ondersteund. Daarbij kan gedacht worden aan de mogelijkheid om gegevens te sorteren, om formules te gebruiken, om een filter op de tabel te kunnen zetten, enzovoorts. Als dergelijke informatie wordt opgeslagen vanuit een spreadsheet-programma mag de gebruiker verwachten dat het bestandsformaat deze potentieel belangrijke eigenschappen (‘significant characteristics’) behoudt. Mocht de tabel in een tekstverwerkingsprogramma zijn gemaakt, dan is het minder waarschijnlijk dat de software deze eigenschappen ondersteunt. Het tekstverwerkingsprogramma is daarentegen geschikt voor het opmaken van een artikel, met bijvoorbeeld gebruik van een functionele inhoudsopgave en paginanummers. Deze eigenschappen zal het spreadsheet-programma niet ondersteunen.

Wanneer informatie uit een toegepast programma wordt opgeslagen, gebeurt dit meestal in een standaard bestandsformaat van deze software. Dit geeft echter niet de garantie dat de inhoud van het databestand in de toekomst op dezelfde wijze gebruikt of weergegeven kan worden zoals bedoeld toen het bestand werd gemaakt. Formaten kunnen bijvoorbeeld afhankelijk zijn van ondersteuning door bepaalde software. Software kan buiten gebruik raken, of slechts bepaalde versies van formaten ondersteunen. Het is ook mogelijk dat specifieke eigenschappen van formaten alleen werken in de gebruikte software, of zelfs enkel in een bepaalde versie van deze software. Ook kunnen bestanden afhankelijk zijn van het gebruik van dure of exclusieve software.

Om het risico van bestandsveroudering voor te zijn en om de toegankelijkheid en de duurzaamheid van de belangrijke eigenschappen van de bestanden te waarborgen, kan een aantal voorzorgsmaatregelen worden genomen. Een van die maatregelen is om bestandsformaten te gebruiken die een grote kans hebben om vele jaren bruikbaar te blijven.