Tijdens het deponeren
Houd tijdens het deponeren van je data rekening met de volgende aspecten.
Ga naar het Data Station
Ga naar het Data Station gericht op jouw wetenschappelijke discipline:
- Data Station Archaeology
- Data Station Social Sciences & Humanities
- Data Station Life Sciences
- Data Station Physical & Technical Sciences
Inloggen
Je hebt verschillende mogelijkheden om in te loggen in de Data Stations.
We raden aan om een federatief account te gebruiken, bij voorkeur je instituutsaccount via SURFConext of een ORCID account.
Als deze twee opties niet beschikbaar zijn voor jou kun je ook gebruik maken van een Github account of een Google account of je kunt een eduID bij wijze van instituutsaccount aanmaken met je e-mailadres.
Als je eerder een dataset in EASY – de voorganger van de Data Stations – hebt gepubliceerd, dan is het ook mogelijk om met de gegevens van je EASY account in te loggen in het Data Station.
Begin met deponeren
Nadat je bent ingelogd op het Data Station, ga je naar ‘Add Data‘ en selecteer ‘New Dataset‘ om je dataset te deponeren.
Metadata invoeren
Het toevoegen van rijke metadata en goede documentatie over je dataset is de belangrijkste stap in het FAIR maken van je data. Als je een nieuwe dataset aanmaakt, zie je een overzicht van alle metadatavelden die je in kunt vullen.
Een klein aantal van deze metadatavelden is verplicht. Echter, hoe meer velden je invoert, hoe beter jouw gegevens gevonden en begrepen kunnen worden.
Algemene achtergrond
- Alle metadata zijn openbaar. De metadatavelden mogen daarom alleen persoonsgegevens bevatten die worden gebruikt om de dataset te verantwoorden. Ze mogen geen persoonsgegevens bevatten van personen die voorkomen in de onderzoeksdata van jouw dataset.
- Wanneer je een dataset bij DANS deponeert wordt automatisch een DOI (Digital Object Identifier) aan de dataset toegekend. Een DOI is een type of persistent identifier (PID) die kan worden gebruikt om naar jouw dataset te verwijzen. De DOI is gereserveerd bij het deponeren en wordt actief na publicatie van de dataset.
- Om een dataset te beschrijven, kun je de taal gebruiken waarin de gegevens zijn vastgelegd. Als dit een andere taal is dan Nederlands of Engels, voeg dan naast de originele beschrijving een samenvatting en trefwoorden in het Nederlands of Engels toe.
- Voor alle metadatavelden zijn hulpteksten beschikbaar die uitleg geven welke informatie verwacht wordt in een bepaald veld. Je kan deze informatie raadplegen door met je muis over het vraagteken naast het metadataveld te bewegen.
Hieronder lichten we enkele elementen uit de verschillende metadata blokken toe waar je speciale aandacht aan moet geven.
Citation metadata
In dit blok kun je algemene informatie geven over je dataset, zoals de titel en een omschrijving van de dataset.
- Het is belangrijk om uitgebreide informatie toe te voegen in de ‘Description’ zodat een gebruiker die de dataset vindt kan begrijpen wat voor data gedeponeerd is en waar de dataset over gaat. Nadat iemand de omschrijving heeft gelezen zou de gebruiker een goed overzicht moeten hebben van de inhoud en het doel van de dataset, hoe het tot stand is gekomen en hoe de data gestructureerd is. Met de informatie uit de omschrijving zou een gebruiker moeten kunnen beoordelen of de data geschikt is voor hergebruik.
- In het metadataveld ‘Author’, kun je je ORCID toevoegen door ORCID te selecteren als ‘identifier scheme’ en dan je ORCID nummer in te voeren (bijvoorbeeld 0000-0001-2345-6789) in het ‘Identifier’ veld. Het systeem genereert automatisch een link in de metadata. Als je ORCID al aan je account van de Data Station gelinkt is, wordt de ORCID hier automatisch voor je ingevuld.
- In het ‘Affiliation’-veld gelinkt aan de ‘Author’ kun je een ROR identifier gebruiken om je organisatie op te zoeken. Als je organisatie een ROR identifier heeft kun je deze selecteren uit de lijst zodat de link gegenereerd wordt.
- In het ‘Keyword’-veld kun je relevante trefwoorden toevoegen. Je hebt in een andere metadata block (zie hieronder) de mogelijkheid om domeinspecifieke trefwoorden toe te voegen van een aantal bestaande domeinspecifieke vocabulaires. Alle andere trefwoorden kun je in het Citation metadata blok toevoegen. Als je een trefwoord van een bestaand vocabulair gebruikt kun je de ‘Term URI’ en de ‘Vocabulary URI’ in de betreffende velden toevoegen.
- Je kunt het metadataveld ‘Distributor’ gebruiken in het geval van digitale herpublicatie van datasets die eerder zijn gepubliceerd. In deze gevallen kun je bij ‘Distributor’ de uitgever invoeren van de oorspronkelijke publicatie.
- In het ‘Language’ -veld selecteer je de taal van de data in de dataset, niet de taal waarin de metadata is geschreven. De taal van de metadata kan worden aangegeven in het ‘Language of Metadata’-veld in het ‘Rights metadata’-blok.
Rights metadata
In dit blok kun je informatie toevoegen over de rechthebbende van de data, persoonsgegevens in de data en de taal van de metadata.
- Geef aan of de dataset persoonsgegevens bevat door ‘Ja’ of ‘Nee’ te selecteren. De ‘Unknown’ optie bestaat voor oudere datasets maar zou niet moeten worden geselecteerd voor nieuwe datasets.
Relation metadata
In dit blok kun je bronnen toevoegen waaraan je dataset gerelateerd is.
- In het ‘Collection’-veld, heb je de mogelijkheid om de dataset toe te voegen aan een bestaande collectie. Het veld Collection is een filter in de Data Station en kan worden gebruikt om alle datasets van een bepaalde collectie te vinden bij het zoeken en browsen. Als je een nieuwe collectie wil toevoegen voor je datasets, neem dan contact op met DANS om de mogelijkheden te bespreken.
- In het veld ‘Relation or Related Material’ kun je verwijzen naar een gerelateerde dataset, publicatie of tijdschriftartikel, bij voorkeur met behulp van de DOI. Indien het artikel nog niet is gepubliceerd, vermeld dit dan achter de titel. Geef in het veld ‘Description’ aan wanneer en waar het artikel naar verwachting zal verschijnen. Specificeer het relatietype met behulp van een van de typeringen die in deze lijst worden beschreven:
Relation: Gebruik deze typering als het relatietype niet kan worden beschreven met een van de andere beschikbare typeringen.
Conforms to: De huidige dataset voldoet aan een bepaalde standaard.
Has format: De huidige dataset is in wezen hetzelfde als een gerelateerde bron maar in een ander formaat.
Has part: De huidige dataset bevat een gerelateerde bron.
References: De huidige dataset verwijst naar, of citeert, een gerelateerde bron.
Replaces: De huidige dataset vervangt een gerelateerde dataset.
Requires: De huidige dataset heeft een gerelateerde bron nodig om de eigen functie, uitlevering of samenhang te ondersteunen.
Has version: Er bestaat een gerelateerde dataset die een versie, editie of aanpassing is van de huidige dataset.
Is format of: Er bestaat een gerelateerde bron die in wezen hetzelfde is als de huidige dataset maar in een ander formaat.
Is part of: De huidige dataset is opgenomen in een gerelateerde bron.
Is referenced by: Er bestaat een gerelateerde bron die naar de huidige dataset verwijst.
Is replaced by: De huidige dataset wordt vervangen door een gerelateerde dataset.
Is required by: Er bestaat een gerelateerde bron die de huidige dataset nodig heeft om de functie, uitlevering of samenhang van die bron te ondersteunen.
Is version of: De huidige dataset is een versie, editie of aanpassing van een gerelateerde dataset.
Temporal and Spatial Coverage
In dit blok kun je informatie geven over de temporele en ruimtelijke aspecten van je dataset.
- Voor de Data Station Archaeology, Life Sciences and Physical and Technical Sciences geeft dit blok de mogelijkheid om een ‘Spatial Point’ en een ‘Spatial Box’ toe te voegen waarin je de coördinaten van de locatie weer kan geven waar het onderzoek betrekking tot heeft. Neem indien mogelijk de coördinaten van de locatie waar het onderzoek is uitgevoerd op als centraal Spatial Point, of gebruik de coördinaten van de uiterste grenzen voor een Spatial Box dat het hele gebied dekt. Als referentiesysteem kun je het Rijksdriehoekstelsel (RD) of Breedtegraad/Lengtegraad (Latitude/Longitude) gebruiken en specificeren. Door coördinaten in de metadata op te nemen is het mogelijk om de dataset te tonen op kaartweergaven, zoals het ARIADNE-portaal, en om op basis van locatie te zoeken naar datasets.
Domain-specific metadata
In dit blok kun je domeinspecifieke informatie toevoegen in de Data Station Archaeology en Social Sciences and Humanities.
Archeologie
In deze sectie kunnen verschillende metadatavelden worden gebruikt om passende gestandaardiseerde termen uit het Nederlandse vocabulaire Archeologisch Basisregister (ABR+) toe te voegen. Als je in deze metadatavelden begint te typen, geeft een autocomplete-functionaliteit de gestandaardiseerde termen voor je weer.
Social Science and Humanities
In deze sectie kun je passende gestandaardiseerde termen toevoegen van de Getty Art and Architecture Thesaurus, de European Language Social Science Thesaurus (ELSST) en de CESSDA Topic Classification. Om methodologische aspecten van je (sociaalwetenschappelijke) data te omschrijven kun je informatie toevoegen in de op DDI-gebaseerde metadata velden, bijvoorbeeld rondom studie design en data collectie.
Bestanden uploaden
Nadat je de metadata hebt toegevoegd kun je bestanden toevoegen aan je dataset. Bekijk onze voorkeursformaten om te zien welke bestandsformaten wij aanraden om je data zo geschikt mogelijk te maken voor archiveren en hergebruik.
Bekijk ook onze handleiding Voor het deponeren voor aanbevelingen rondom documentatie bestanden die je toe kunt voegen aan je dataset (zoals codebooks, transcripts, readme bestanden).
Meerdere bestanden kunnen worden geüpload in een ZIP- of TAR-bestand (andere vormen van bestandscompressie zoals .rar of .7z worden niet door DANS ondersteund). De ZIP- of TAR-bestanden worden automatisch uitgepakt tijdens de upload. Een grote dataset kan worden opgedeeld in meerdere ZIP- of TAR-bestanden. Let op: een ZIP-bestand binnen een ander ZIP-bestand wordt niet ondersteund.
ZIP-bestanden met meer dan 2000 bestanden zullen niet automatisch worden uitgepakt. Het ZIP-bestand wordt door het Data Station geïndexeerd, wat wil zeggen dat de inhoud van de ZIP na publicatie van de dataset gemakkelijk bekeken en doorzocht kan worden. Het is dan zelfs mogelijk voor gebruikers om individuele bestanden rechtstreeks uit het ZIP-bestand te downloaden. De opslag van data als ZIP-bestanden kan daarmee een goede oplossing zijn voor hele grote datasets (meerdere GB’s) of bij grote volumes aan data (duizenden bestanden). Als je zulke grote datasets wil deponeren, neem contact op met DANS.
Elke gebruiker mag tot 50 GB aan data deponeren. Als je dit wilt overschrijden, neem dan contact op met DANS. Bij grotere data deponeringen of collecties kunnen kosten worden berekend. Meer informatie is hier beschikbaar.
Toegangscategorie en licentie kiezen
DANS ondersteunt Open Science en moedigt deposanten aan om hun data ‘zo open mogelijk, zo gesloten als nodig’ beschikbaar te stellen.
Sommige data kunnen niet openbaar beschikbaar worden gesteld en in dat geval kun je ervoor kiezen om de toegang tot databestanden te beperken. Als dit voor jouw dataset van toepassing is raadpleeg dan onze guidebook voor het deponeren van restricted access data [in het Engels].
Wanneer je een bestand upload dan staat dit bestand eerst standaard op Open Access en de licentie van de dataset staat standaard op CC0 1.0. Als je hiervan af wil wijken dan moet je de licentie en de toegangscategorie in de Data Station aanpassen voordat je de dataset indient voor review.
Een licentie selecteren
Lees hier meer over de verschillende licenties die DANS aanbiedt. Om een andere licentie te selecteren dan CC0 1.0, ga je naar het tabblad ‘Terms’ nadat je de metadata van je dataset hebt opgeslagen. Selecteer op dit tabblad ‘Edit Terms Requirements‘. Je hebt dan de mogelijkheid om een andere licentie te selecteren uit een menu met verschillende beschikbare gebruikerslicenties.
- Voor open datasets kun je kiezen uit alle Creative Commons licenties en andere open licenties.
- Bij Restricted Access is het gebruik van de dataset altijd onderworpen aan de DANS-licentie en moet je deze licentie kiezen.
De licentie die je selecteert geldt voor alle bestanden in de dataset. De metadata van de dataset is echter altijd open toegankelijk en vrij beschikbaar in het publieke domein (CC0 1.0).
Toegang tot bestanden beperken
Voor elk afzonderlijk bestand dat bij de dataset is geüpload, kun je via ‘File Options’/’Edit Files’ selecteren of de toegang tot het bestand moet worden beperkt of dat het bestand open toegankelijk is. Je kunt deze instelling ook voor meerdere bestanden of voor alle bestanden tegelijk bewerken door de selectievakjes voor de bestanden te gebruiken. Open bestanden kunnen door iedereen worden gedownload. Bestanden met een toegangsbeperking kunnen alleen gedownload worden door gebruikers wanneer zij een toegangsverzoek hebben ingediend en deze is goedgekeurd door de deposant.
Nadat je hebt gekozen om de toegang te beperken, moet je het vakje ‘Enable access request’ aanvinken zodat gebruikers de gegevens met jouw voorafgaande toestemming kunnen bekijken en downloaden.
Houd er rekening mee dat het binnen één en dezelfde dataset niet mogelijk is om bepaalde bestanden met Restricted Access te hebben waarvoor toegangsverzoeken zijn ingeschakeld, en andere bestanden met Restricted Access waarvoor toegangsverzoeken zijn uitgeschakeld. Zodra je toegangsverzoeken inschakelt voor zelfs maar één bestand met Restricted Access wordt deze optie automatisch ingesteld voor alle bestanden met Restricted Access in de gehele dataset (in alle versies ervan).
Houd er ook rekening mee dat wanneer je een nieuwe versie van een bestand met toegangsbeperking uploadt, het nieuwe bestand niet automatisch op Restricted Access zal worden gezet. Bestanden die worden geüpload moeten altijd opnieuw op Restricted Access worden gezet.
Embargo
Als je een embargo op de bestanden wilt instellen, kun je dit voor elk afzonderlijk bestand aangeven via ‘File Options’/’Edit Files’. Je kunt deze instelling ook voor meerdere bestanden of voor alle bestanden tegelijk bewerken door de selectievakjes voor de bestanden te gebruiken. Zodra het embargo is afgelopen wordt de dataset beschikbaar onder de gekozen licentie en toegangscategorie.
DANS adviseert een maximale embargoperiode van 6 maanden.
Retentie Periode
Vergelijkbaar met de embargo periode, kun je ook een retentieperiode vaststellen via ‘File Options’/’Edit Files’. Na het verlopen van de retentieperiode zijn de bestanden niet meer beschikbaar voor download.
Licentie en toegang wijzigen
Je kunt de Access-categorie, licentie of embargo van een gepubliceerde dataset wijzigen. Dit doe je door de Term Requirements te wijzigen of door de opties van de bestanden aan te passen. Een wijziging naar een meer open licentie en minder restricties op de toegang van de data zijn altijd toegestaan. Als je de licentie wilt veranderen naar een strengere licentie of de toegang tot open bestanden wil beperken, neem dan eerst contact op met DANS zodat wij de situatie samen kunnen beoordelen.
Wijzigingen in licenties en/of toegangsbeperkingen leiden altijd tot een nieuwe versie van de dataset. Nieuwe versies moeten altijd worden ingediend bij het Data Processing Team van DANS, die deze beoordelen en publiceren.
Houd er rekening mee dat wanneer je de retentieperiode van een gepubliceerde dataset wil aanpassen dat je hiervoor contact op moet nemen met DANS om dit te veranderen.
Dien de dataset in voor beoordeling
Nadat je alle metadata hebt ingevuld, je bestanden hebt geüpload, de juiste toegangscategorieën en metadata hebt gekozen, kun je je dataset indienen bij DANS.
Dien de dataset in voor review door met de knop ‘Submit for Review’. Je ontvangt een e-mail met de bevestiging dat de dataset is ingediend. De e-mail bevat ook de persistent identifier van de dataset. Let op: je kunt de dataset niet meer zelf wijzigen zonder een nieuwe versie te creëren. Mochten er toch nog wijzigingen nodig zijn, neem dan contact op met een datamanager bij DANS.
Als de indiening mislukt, is het mogelijk dat een verplicht veld niet is ingevuld. Het systeem geeft het betreffende veld aan. Klik nogmaals op ‘Submit for Review’ wanneer je dit veld alsnog hebt ingevuld.
Publicatie door DANS
DANS controleert en verwerkt de dataset en publiceert deze in overeenstemming met de Terms of Use en de Data Stations Policy.
Ons Data Processing Team beoordeelt de datasets die binnenkomen en zorgt ervoor dat de kwaliteit van de data in onze Data Stations hoog is en dat de data FAIR zijn. Je kunt meer lezen over het curatieproces van DANS in onze Data Processing Handleiding en in de sectie Na het deponeren van onze handleiding.
Als wij vragen hebben over je dataset of meer informatie nodig is voordat we een dataset kunnen publiceren, dan neemt een van onze medewerkers contact met je op.
Als je dataset is goedgekeurd door DANS, wordt de dataset gepubliceerd en ontvang je een e-mail.
De DOI van je dataset wordt geactiveerd en je gegevens worden permanent gearchiveerd volgens internationale certificeringsrichtlijnen. Je dataset zal voor anderen vindbaar zijn, en toegankelijk met inachtneming van de toegangscategorie, licentie en mogelijke beperkingen die je hebt ingesteld. De Data Stations Policy geeft meer informatie over hoe DANS de toegankelijkheid en leesbaarheid van datasets waarborgt, en beschrijft de principes die DANS toepast bij het duurzaam bewaren van digitale onderzoeksdata.
De volgende aspecten worden beschreven:
- De gekozen aanpak voor het duurzaam archiveren van data.
- De authenticiteit van de gegevens.
- De verschillende stappen in het archiveringsproces, zoals het deponeren, duurzaam en veilig opslaan en beschikbaar stellen van gegevens, allemaal volgens het internationaal referentiemodel voor digitale archiefsystemen OAIS (Open Archival Information System).
In de laatste sectie van onze handleiding ‘Na het deponeren’ vind je alle informatie over het gebruik van onze Data Station nadat je dataset gepubliceerd is. De sectie bevat onder meer informatie over het beoordelen van toegangsverzoeken en instructies hoe je je dataset kunt updaten wanneer dat nodig is.
© DANS. R.5.3 Versie 1.6, 1 augustus 2025