Voorafgaand aan het deponeren
Fijn dat je de Data Stations wil gebruiken om je data FAIR te maken! De volgende punten zijn van belang voordat je jouw data bij ons deponeert:
Bekijk ons selectiebeleid
Bekijk voordat je data deponeert het selectiebeleid van de Data Stations om te controleren of je dataset voldoet aan onze richtlijnen.
Het deponeren van data in een Data Station is voor individuele onderzoekers kosteloos, tot 50 GB per account. Meer informatie vind je op deze pagina.
Bekijk onze terms of use
Wanneer je een account aanmaakt voor de Data Stations, ga je akkoord met de Terms of Use. Deze voorwaarden hebben betrekking op het algemene gebruik van de Data Stations, zoals het aanvragen en downloaden van datasets, en op het deponeren van datasets. Aanvullende informatie over het beleid van de Data Stations is beschikbaar in de Data Stations Policy.
FAIR data voorbereiden
De DANS Data Stations zijn domeinspecifieke betrouwbare digitale repositories die je kunnen helpen om je data FAIR – vindbaar, toegankelijk, uitwisselbaar, herbruikbaar – te kunnen maken. Voordat je je data deponeert is het goed om te begrijpen wat FAIR betekent. Deze richtlijnen [in het Engels] geven een overzicht van de stappen die data eigenaren en repositories kunnen nemen om de FAIRness van data te vergroten. Als je meer wil weten over het werk dat DANS doet op het gebied van FAIR data in verschillende projecten, kun je meer informatie vinden op de site van onze data-expertise sectie.
Het goede nieuws is dat door data te deponeren in een Data Station veel aspecten van de FAIR principes voor je worden geregeld door DANS: Wij zorgen voor een persistent identifier (PID) voor je data, maken je data vindbaar in gestandaardiseerde formaten, en zorgen ervoor dat je data gedownload kan worden voor hergebruik – of direct (open access) of nadat een toegangsverzoek is goedgekeurd (restricted access). Jouw verantwoordelijkheid om je data FAIR te maken ligt met name in het beschikbaar stellen van gedetailleerde metadata en documentatie zodat anderen je data kunnen begrijpen en weten hoe ze de data kunnen hergebruiken.
Overwegingen bij persoonsgegevens
Persoonsgegevens in de zin van de Algemene Verordening Gegevensbescherming (AVG) zijn gegevens waarmee een levend persoon geïdentificeerd kan worden, direct of indirect. Bijvoorbeeld via een naam, een identificatienummer, locatiegegevens, een online identificator of via elementen die kenmerkend zijn voor iemands fysieke, fysiologische, genetische, psychische, economische, culturele of sociale identiteit. Wanneer gegevens anoniem zijn, is er geen sprake van persoonsgegevens. Gepseudonimiseerde gegevens zijn wel persoonsgegevens.
Het is belangrijk om stil te staan bij de volgende overwegingen wanneer je persoonsgegevens in de Data Station onderbrengt:
- Jij of jouw organisatie is verwerkersverantwoordelijke van de data en DANS is verwerker van de data. Door het accepteren van de Terms of Use, ga je akkoord met het Processing Addendum.
- Als verwerkingsverantwoordelijke in de zin van de AVG ben jij of jouw organisatie verantwoordelijk voor de juiste verwerking van persoonsgegevens in jouw dataset. Afhankelijk van je project kun je hierbij denken aan het de-identificeren en minimaliseren van persoonsgegevens, en het versleutelen van de data. Bij het versleutelen van data, is het van belang dat je de sleutel beveiligd en duurzaam elders bewaart. Jouw organisatie heeft mogelijk extra richtlijnen en ondersteuning beschikbaar rondom de omgang met persoonsgegevens in onderzoeksdata en lokaal beleid.
- Het is mogelijk nodig om jouw bestanden met persoonsgegevens als restricted te archiveren. Op deze manier kun je de toegang tot deze bestanden beheren en heb je de mogelijkheid om passende voorwaarden voor hergebruik op te leggen. Als verwerkersverantwoordelijke ben je zelf volledig verantwoordelijk voor passende restricties en gebruiksvoorwaarden. Meer informatie over restricted access deponeren is beschikbaar in deze handleiding [in het Engels].
- Als verwerkersverantwoordelijke draag jij zorg voor de juridische basis waaronder je persoonsgegevens bij DANS kan deponeren. In veel gevallen zal er aan deelnemers toestemming moeten worden gevraagd om persoonsgegevens te archiveren en publiceren. Het kan handig zijn om een lege kopie van de informed consent formulieren toe te voegen aan de documentatie van je dataset in de Data Stations. De ingevulde en ondertekende informed consent formulieren mogen echter niet toegevoegd worden aan de dataset. Deze formulieren bevatten persoonlijke informatie van de deelnemers die apart van de data moeten worden bewaard door de data eigenaar.
Documentatie en bestanden voorbereiden
Bestanden selecteren en formaten
Niet alle bestandsformaten geven zekerheid over de bruikbaarheid, toegankelijkheid en duurzaamheid van data op de lange termijn. DANS werkt met ‘Preferred Formats’ (voorkeurs bestandsformaten). Meer informatie staat op de webpagina Bestandsformaten. Voor de duurzame archivering kan DANS bestanden naar een voorkeursformaat converteren indien in een ander formaat geleverd. Een gecureerde versie van jouw dataset zal dan als een nieuwe versie worden gepubliceerd.
Documentatie en bestanden voorbereiden
- Welke bestanden deponeer je? Niet alle data hoeven voor de lange termijn bewaard te worden. Meer informatie hierover vind je op de webpagina ‘Onderzoeksgegevens selecteren’ op de website van Research Data Netherlands.
- Niet alle bestandsformaten geven zekerheid over de bruikbaarheid, toegankelijkheid en duurzaamheid van data op de lange termijn. DANS werkt met ‘Preferred Formats’ (voorkeurs bestandsformaten). Meer informatie staat op de webpagina Bestandsformaten.
- Voor de duurzame archivering kan DANS bestanden naar een voorkeursformaat converteren indien in een ander formaat geleverd. Een gecureerde versie van jouw dataset zal dan als een nieuwe versie worden gepubliceerd.
- Een van de conversies die Dataverse – de software van Data Stations – automatisch uitvoert, is de transformatie van een tabulair bestand, zoals een SPSS-bestand of een ander statistisch bestand, naar een TAB-bestand. Deze functionaliteit werkt alleen voor bestanden waarvan de inhoud als een tabel kan worden geïnterpreteerd. Spreadsheets met meerdere bladen en CSV-bestanden met een verschillend aantal items per rij zijn twee voorbeelden waarbij het omzetten niet uitgevoerd wordt. Houd hier rekening mee bij het uploaden van tabulaire bestanden.
- Om de duidelijkheid van de inhoud van de dataset te behouden, raden we aan om het gebruik van gecomprimeerde bestanden te vermijden (zoals ZIP, RAR, 7z etc). De opslag van data als ZIP-bestanden kan wel een oplossing zijn voor hele grote datasets (meerdere GB’s) of bij grote volumes aan data (duizenden bestanden). Je kunt bijvoorbeeld gebruikmaken van ZIP- or TAR-bestanden om gemakkelijk veel bestanden tegelijk te uploaden (zie ‘Tijdens deponeren’). ZIP-bestanden met minder dan 2000 bestanden worden dan automatisch uitgepakt. Mocht je grote datasets willen deponeren neem contact op met DANS.
- Bevat jouw dataset veel bestanden? Lever dan ook een bestandenlijst aan: een opsomming van de bestanden, een beschrijving van de inhoud van en de mogelijke samenhang tussen de bestanden.
Documentatie toevoegen
- Het toevoegen van relevante documentatie is heel belangrijk om je dataset begrijpelijk en herbruikbaar te maken. Deze handleiding [in het Engels] van het Consortium of European Social Science Data Archives geeft tips voor het maken van goede documentatie en het duidelijk structureren van je data. Het is belangrijk om informatie aan je dataset toe te voegen over hoe je data is verzameld, wat verschillende variabelen in je dataset betekenen en wat de betekenis is van afkortingen of vakterminologie. Relevante documenten om toe te voegen aan je dataset zijn ook bijvoorbeeld codeboeken of uitleg over de datasetstructuur.
- Bevat jouw dataset persoonsgegevens? Let er dan op dat de bestandsnamen geen persoonsgegevens bevatten die niet openbaar mogen zijn. Bestandsnamen zijn namelijk door iedereen te bekijken.
- Als je je data wil deponeren met restricted access, raadpleeg dan deze handleiding [in het Engels] en maak een Data Access Protocol waarin gedocumenteerd wordt welke toegangsvoorwaardes er zijn voor de restricted access data
Discipline specifieke aanleverspecificaties
Voor de onderstaande disciplines geldt de volgende aanleverspecificatie:
- Kwalitatieve data (bijvoorbeeld Oral History):
- Kwalitatieve data herbruikbaar maken geeft specifieke uitdagingen. In deze handleiding [in het Engels] kun je tips en trucs vinden specifiek voor onderzoek met kwalitatieve data.
- Een transcriptie met metadata van het interview is zeer wenselijk met het oog op hergebruik van de data. DANS heeft samen met de Universiteit van Amsterdam een Metadata Transcriptie Template ontwikkeld die je hiervoor kunt gebruiken.
- Als je dataset audio- of videobestanden bevat, kun je een bestand met ondertiteling toevoegen die bij het afspelen gebruikt kan worden. De ondersteuning werkt alleen als de naam van het bestand de volgende structuur volgt: <basename audio video>.(language code>.vtt.
Er zijn drie talen beschikbaar:
<language code> = nl <basename audio video>.nl.vtt
<language code> = de <basename audio video>.de.vtt
<language code> = en <basename audio video>.en.vtt
- Historische wetenschappen:
- Beschrijf de (archivalische) bronnen.
- Beschrijf de gebruikte selectieprocedure.
- Beschrijf de manier waarop de bronnen zijn gebruikt.
- Geef referenties op naar de standaarden of classificatiesystemen (zoals HISCO) die zijn gebruikt.
- Sociaal- en gedragswetenschappen:
- Beschrijf de variable-labels en value-labels.
- Beschrijf de vragenlijst(en) of andere onderzoeksinstrumenten.
- Voeg de veldwerkrapportage toe (indien beschikbaar).
- Voeg een codebook toe: een beschrijving van de variabelen en informatie over de populatie, soort data (units of observation/analysis), steekproef(procedure), (non)respons, methode van data verzamelen, wegingsvariabelen en geconstrueerde en/of afgeleide variabelen.
- Zorg ervoor dat de taal van de variable-labels en value-labels correspondeert met de taal van de rest van de dataset. De metadata moet in het Engels of Nederlands worden aangeleverd.
- Taal- en literatuurwetenschappen:
- Voor CLARIN-conforme aanlevering, zorg ervoor dat jouw dataset één of meer metadatabestanden bevat in het Component MetaData Infrastructure-formaat.
- Voor interactieve 3D-content binnen het vakgebied digitaal erfgoed en digitale geesteswetenschappen kun je deze richtlijnen raadplegen [in het Engels].
- Archeologie:
- Wil je meer weten over het E-depot voor de Nederlandse archeologie? Kijk dan hier.
- Wanneer archeologische projecten zijn beschreven met de archeologische pakbon (SIKB0102 standaard) dienen deze projecten bij het ArcheoDepot ingediend te worden. De bestanden van de datasets die bij de Provincies worden gedeponeerd moeten worden aangeleverd in ‘Preferred Formats’.
- Via het ArcheoDepot worden datasets automatisch vanuit de provincies naar het archief van DANS gestuurd.
- In de opstartfase van het ArcheoDepot is het ook nog steeds mogelijk je data direct bij DANS aan te leveren indien de provincie nog niet is aangesloten op het ArcheoDepot.
- Let op het voorkomen van contactgegevens van veldmedewerkers of andere betrokkenen in de documenten, zoals in het overzicht van personeel in het Plan van Aanpak of in de administratieve gegevens van de eindrapportage. Refereer aan het stuk Persoonsgegevens hierboven indien hier persoonlijke contactgegevens tussen staan.
- Levenswetenschappen – Medisch
- Voor het omgaan met data kun je de richtlijnen volgen van het Data Stewardship Handbook (HANDS) van Health-RI/NFU.
- Voeg relevante metadata toe van je Electronic Lab Notebook.
- Voeg waar mogelijk identifiers toe van gerelateerde onderzoeksdata en publicaties, alsook van CTR, CCMO, preclinical trial registries en GenBank accessionnummers. Hiervoor kun je het ‘Relation’ metadata blok gebruiken.
- Levenswetenschappen – Gezondheid
- Voor het omgaan met data kun je de richtlijnen volgen van het Data Stewardship Handbook (HANDS) van Health-RI/NFU.
- Voor cohort- en populatie studies beschrijf de variabele labels en waardelabels.
- Beschrijf de vragenlijsten en andere onderzoekstools, maar zorg ervoor dat je geen informatie uit vragenlijst deelt die beschermd zijn onder het auteursrecht, zoals beschikbaar op https://euroqol.org/.
- Voeg een codebook toe met relevante informatie zoals de variabelen, de populaties, soorten gegevens (eenheden van observatie/analyse), steekproefprocedure, respons/non-respons, methode van gegevensverzameling, weegvariabelen, geconstrueerde en/of afgeleide variabelen.
- Voor gezondheidsdata in een bepaalde geografische omgeving, voeg de relevante geografische informatie toe (beschrijvende locatiegegevens, kaders, polygonen).
- Levenswetenschappen – Biologie, Ecologie, Biodiversiteit en Landbouw
- Geef in de omschrijving van de dataset duidelijk aan op welk level je onderzoek betrekking heeft (Moleculair, Macromoleculen, Organellen, Cellen, Weefsels, Organen, Orgaansystemen, Organismen, Populaties, Gemeenschappen, Ecosysteem(en), Biomen, Biosfeer).
- Voeg, waar van toepassing, een lijst met van de soorten die het onderwerp waren van het onderzoek toe, inclusief referentie naar de gebruikte taxonomie (Catalogue of Life, Dutch Species Register, etc.).
- Voor veldonderzoek in een bepaalde geografische omgeving, voeg de relevante geografische informatie toe (beschrijvende locatiegegevens, kaders, polygonen). Je kunt meerdere locaties toevoegen aan een dataset.
- Natuur en technische wetenschappen
- Voor technische datasets, zoals datasets uit de techniek, materiaalstudies, natuurkunde, computing, enz. is de 4TU.ResearchData repository het meest geschikt.
- Voor het deponeren van software, is het aan te raden om gebruik te maken van het Software Heritage Archive en niet de DANS Data Station for Physical and Technical Sciences.
- Voor datasets uit de chemie, gebruik de IUPAC terminology.
- Voor geografische en milieudatasets, voeg de relevante geografische informatie toe (beschrijvende locatiegegevens, kaders, polygonen).
Aanvullende informatie
Onderzoeksdata management algemeen
- Er zijn in Nederland meerdere lokale Digital Competence Centres die je informatie kunnen geven over jouw specifieke project en het RDM-beleid van jouw instelling. De LCRDM (Landelijk Coördinatiepunt Research Data Management) website heeft een overzicht van de research data management pagina’s van de verschillende instellingen.
- De CESSDA Data Management Expert Guide [in het Engels] geeft informatie over RDM (in de sociale wetenschappen) voor de verschillende stappen in het onderzoeksproces.
- De ELIXIR Research Data Management toolkit for Life Sciences [in het Engels] geeft RDM richtlijnen gericht op gezondheidsdata, medische en klinische studies in de levenswetenschappen.
- De practical guide to Open Science for Early-Career Researchers [in het Engels] geeft tips, trucs en tools voor het implementeren van Open Science.
- Het Landelijk Coördinatiepunt Research Data Management (LCRDM) geeft algemene tips en advies.
AVG en persoonsgegevens
- Verschillende Nederlandse universiteiten bieden lokaal advies rondom de omgang met persoonsgegevens. Een voorbeeld is de Data privacy handbook [in het Engels] die door de Universiteit Utrecht is ontwikkeld.
- SURF Wikiwijs e-learning module ‘Privacy in onderzoek’.
- De European Data Protection Board (EDPB) biedt richtsnoeren, aanbevelingen en best practices.
- Voor vragen rondom ethische en juridische kwesties op het gebied van de medische en gezondheidswetenschappen kun je contact opnemen met de Health-RI ELSI Servicedesk.
© DANS. R.5.2 Versie 1.4, 11 augustus 2025