Tijdens het deponeren

Houd tijdens het deponeren van je data rekening met de volgende aspecten.

Ga naar het Data Station
Ga naar het Data Station gericht op jouw wetenschappelijke discipline:

Inloggen
Gebruik bij voorkeur je instituutsaccount via SURFConext om in te loggen, of gebruik een Google of Github account. Als je geen van deze mogelijkheden kan gebruiken, kun je een eduID bij wijze van instituutsaccount aanmaken met je e-mailadres. Als je eerder een dataset in EASY – de voorganger van de Data Stations – hebt gepubliceerd dan is het ook mogelijk om met de gegevens van je EASY account in te loggen in het Data Station.

Begin met deponeren
Nadat je bent ingelogd op het Data Station, ga ja naar ‘Add Data‘ en selecteer ‘New Dataset‘ om je dataset te deponeren.

Metadata
Een klein aantal metadatavelden waarmee wordt gevraagd jouw dataset te omschrijven, is verplicht. Echter, hoe meer velden je invoert, hoe beter jouw gegevens gevonden kunnen worden. Alle metadata is openbaar. De metadatavelden mogen alleen persoonsgegevens bevatten die worden gebruikt om de dataset te verantwoorden. Ze mogen geen persoonsgegevens bevatten van personen die voorkomen in de onderzoeksdata van jouw dataset.

  • Wanneer je een dataset bij DANS deponeert wordt automatisch een DOI (Digital Object Identifier) ​​aan de dataset toegekend. Dit is een permanente hyperlink die kan worden gebruikt om naar jouw dataset te verwijzen. De DOI is gereserveerd bij het deponeren en wordt actief na publicatie van de dataset.
  • Gebruik de taal waarin de gegevens zijn vastgelegd. Als dit een andere taal is dan Nederlands of Engels, voeg dan naast de originele beschrijving een samenvatting en trefwoorden in het Nederlands of Engels toe.
  • Voor alle metadatavelden zijn hulpteksten beschikbaar die uitleg geven welke informatie verwacht wordt in een bepaald veld. Je kan deze informatie raadplegen door met je muis over het vraagteken naast het metadataveld te bewegen. 

Algemene metadata 

  • In de sectie ‘Citation Metadata’, in het metadataveld ‘Author’, kun je je ORCID toevoegen door ORCID te selecteren als ‘identifier scheme’ en dan je ORCID nummer in te voeren (bijvoorbeeld 0000-0001-2345-6789) in het ‘Identifier’ veld. Het systeem genereert automatisch een link in de metadata.
  • In de sectie ‘Citation Metadata’, kun je het metadataveld ‘Distributor’ gebruiken in het geval van digitale herpublicatie van datasets die eerder zijn gepubliceerd. In deze gevallen kun je bij ‘Distributor’ de uitgever invoeren van de oorspronkelijke publicatie.
  • In de sectie ‘Relation Metadata’ heb je de mogelijkheid om de dataset toe te voegen aan een bestaande Collection. Hiermee kunnen bijvoorbeeld alle datasets van dezelfde organisatie aan één collectie worden toegewezen. Het veld Collection kan vervolgens worden gebruikt als filter voor zoeken en browsen.
  • In de sectie ‘Relation Metadata’ kun je in het veld ‘Relation or Related Material’ verwijzen naar een gerelateerde dataset, publicatie of tijdschriftartikel, bij voorkeur met behulp van de DOI. Indien het artikel nog niet is gepubliceerd, vermeld dit dan achter de titel. Geef in het veld ‘Description’ aan wanneer en waar het artikel naar verwachting zal verschijnen. Specificeer het relatietype met behulp van een van de typeringen die in deze lijst worden beschreven:

Relation: Gebruik deze typering als het relatietype niet kan worden beschreven met een van de andere beschikbare typeringen.
Conforms to: De huidige dataset voldoet aan een bepaalde standaard.
Has format: De huidige dataset is in wezen hetzelfde als een gerelateerde bron maar in een ander formaat.
Has part: De huidige dataset bevat een gerelateerde bron.
References: De huidige dataset verwijst naar, of citeert, een gerelateerde bron.
Replaces: De huidige dataset vervangt een gerelateerde dataset.
Requires: De huidige dataset heeft een gerelateerde bron nodig om de eigen functie, uitlevering of samenhang te ondersteunen.
Has version: Er bestaat een gerelateerde dataset die een versie, editie of aanpassing is van de huidige dataset.
Is format of: Er bestaat een gerelateerde bron die in wezen hetzelfde is als de huidige dataset maar in een ander formaat.
Is part of: De huidige dataset is opgenomen in een gerelateerde bron.
Is referenced by: Er bestaat een gerelateerde bron die naar de huidige dataset verwijst.
Is replaced by: De huidige dataset wordt vervangen door een gerelateerde dataset.
Is required by: Er bestaat een gerelateerde bron die de huidige dataset nodig heeft om de functie, uitlevering of samenhang van die bron te ondersteunen.
Is version of: De huidige dataset is een versie, editie of aanpassing van een gerelateerde dataset.

Archeologische metadata

  • Het Data Station Archaeology heeft een sectie voor ‘Archaeology-Specific Metadata‘. In deze sectie kunnen verschillende metadatavelden worden gebruikt om passende gestandaardiseerde termen uit de Nederlandse vocabulaire Archeologisch Basisregister ( ABR+) toe te voegen. Als je in deze metadatavelden begint te typen, geeft een autocomplete-functionaliteit de gestandaardiseerde termen voor je weer.
  • Neem indien mogelijk de coördinaten van de locatie waar het onderzoek is uitgevoerd op als centraal Spatial Point, of gebruik de coördinaten van de uiterste grenzen voor een Spatial Box dat het hele gebied dekt. Als referentiesysteem kun je het Rijksdriehoekstelsel (RD) of Breedtegraad/Lengtegraad (Latitude/Longitude) gebruiken en specificeren. Door coördinaten in de metadata op te nemen is het mogelijk om de dataset te tonen op kaartweergaven, zoals het ARIADNE-portaal, en om op basis van locatie te zoeken naar datasets.

Sociaal- en geesteswetenschappelijke metadata

  • Voor datasets uit de sociale – en geesteswetenschappen, is er een speciaal metadatablok in het Data Station SSH waar extra informatie over de dataset toegevoegd kan worden. Er zijn verschillende extra velden en vocabulaires die worden aanbevolen door het  Europese consortium van sociaalwetenschappelijke data archieven (CESSDA).
  • Het onderwerp van de data kan omschreven worden met termen uit de European Language Social Science Thesaurus (ELSST) en een lijst van onderwerpen samengesteld door CESSDA. Methodologische aspecten van de dataset kunnen omschreven worden met behulp van vocabulaires van de Data Documentation Initiative (DDI). Hier kun je bijvoorbeeld informatie toevoegen over het ontwerp van het onderzoek, de dataverzameling en de analyse.
  • In de toekomst zullen we nog meer metadatavelden, specifiek gericht op de geesteswetenschappen toevoegen.

 

Toegangscategorie en licentie
DANS ondersteunt Open Science en moedigt deposanten aan om hun data ‘zo open mogelijk, zo gesloten als nodig’ beschikbaar te stellen.

Een licentie selecteren
Bij het deponeren van een dataset staat deze standaard op Open Access met de CC0 1.0 licentie. Lees hier meer over de licenties die DANS aanbiedt. Om een ​​andere licentie te selecteren dan CC0 1.0, ga je naar het tabblad ‘Terms’ nadat je de metadata van je dataset hebt opgeslagen. Selecteer op dit tabblad ‘Edit Terms Requirements‘. Je hebt dan de mogelijkheid om een ​​andere licentie te selecteren uit een menu met verschillende beschikbare gebruikerslicenties. Voor open datasets kun je kiezen uit alle Creative Commons licenties en andere open licenties.  Bij Restricted Access is het gebruik van de dataset altijd onderworpen aan de DANS-licentie en moet je deze licentie kiezen. De toegangs- en gebruikersvoorwaarden gelden voor de databestanden van de dataset. De metadata van de dataset is altijd open toegankelijk en vrij beschikbaar.

Toegang beperken
Sommige datasets of bestanden kunnen niet openbaar beschikbaar gesteld worden en dan kun je kiezen om de toegang te beperken. Voor elk afzonderlijk bestand dat bij de dataset is geüpload, kun je via ‘File Options‘/’Edit Files‘ selecteren of de toegang tot het bestand moet worden beperkt. Je kunt deze instelling ook voor meerdere bestanden of voor alle bestanden tegelijk bewerken door de selectievakjes voor de bestanden te gebruiken. Nadat je hebt gekozen om de toegang te beperken, moet je het vakje ‘Enable access request‘ aanvinken zodat gebruikers de gegevens met jouw voorafgaande toestemming kunnen bekijken en downloaden.

Houd er rekening mee dat het binnen één en dezelfde dataset niet mogelijk is om bepaalde bestanden met Restricted Access te hebben waarvoor toegangsverzoeken zijn ingeschakeld, en andere bestanden met Restricted Access waarvoor toegangsverzoeken zijn uitgeschakeld. Zodra je toegangsverzoeken inschakelt voor zelfs maar één bestand met Restricted Access wordt deze optie automatisch ingesteld voor alle bestanden met Restricted Access in de gehele dataset (in alle versies ervan).

Embargo
Als je een embargo op de bestanden wilt instellen, kun je dit voor elk afzonderlijk bestand aangeven via ‘File Options’/’Edit Files’. Je kunt deze instelling ook voor meerdere bestanden of voor alle bestanden tegelijk bewerken door de selectievakjes voor de bestanden te gebruiken. Zodra het embargo is afgelopen wordt de dataset beschikbaar onder de gekozen licentie. DANS adviseert een maximale embargoperiode van 6 maanden. 

Wijzigingen doorvoeren
Je kunt de Access-categorie, licentie of embargo van een gepubliceerde dataset wijzigen. Dit doe je door de Term Requirements te wijzigen of door de opties van de bestanden aan te passen. Een wijziging naar een meer open licentie en minder restricties op de toegang van de data zijn altijd toegestaan. Als je de licentie wilt veranderen naar een strengere licentie of de toegang tot open bestanden wil beperken, neem dan eerst contact op met DANS zodat wij de situatie samen kunnen beoordelen. Wijzigingen in licenties en/of toegangsbeperkingen leiden altijd tot een nieuwe versie van de dataset. Nieuwe versies moeten altijd worden ingediend bij het Data Processing Team van DANS, die deze kan publiceren. 

 

Bestanden uploaden
Meerdere bestanden kunnen worden geüpload in één .zip of .tar (andere vormen van bestandscompressie zoals ‘.rar’ of .7z worden niet door DANS ondersteund).  De .zip- of .tar-bestanden worden automatisch uitgepakt tijdens de upload. Een grote dataset kan worden opgedeeld in meerdere .zip of .tar bestanden. Let op: een .zip-bestand binnen een ander .zip-bestand wordt niet ondersteund.

Als je grotere bestanden (groter dan 9 GB) wilt uploaden en hierbij problemen ervaart neem dan contact op met een datamanager van DANS.

Elke gebruiker mag tot 50 GB aan data deponeren. Als je dit wilt overschrijden, neem dan contact op met DANS. Bij grotere data deponeringen of collecties kunnen kosten worden berekend. Meer informatie is hier beschikbaar.

 

Dien de dataset in voor beoordeling
Dien de dataset in voor review door met de knop ‘Submit for Review’. Je ontvangt een e-mail met de bevestiging dat de dataset is ingediend. De email bevat ook de persistent identifier van de dataset. Let op: je kunt de dataset niet meer zelf wijzigen zonder een nieuwe versie te creëren. Mochten er toch nog wijzigingen nodig zijn, neem dan contact op met een datamanager bij DANS.

Als de indiening mislukt, is het mogelijk dat een verplicht veld niet is ingevuld. Het systeem geeft het betreffende veld aan. Klik nogmaals op ‘Submit for Review’ wanneer je dit veld alsnog hebt ingevuld.

 

Publicatie door DANS
DANS controleert en verwerkt de dataset en publiceert deze in overeenstemming met de Terms of Use en Data Stations Policy. De persistent identifier wordt geactiveerd en je gegevens worden permanent gearchiveerd volgens internationale certificeringsrichtlijnen. Je dataset zal voor anderen vindbaar zijn, en toegankelijk met inachtneming van de toegangscategorie, licentie en mogelijke beperkingen die je hebt ingesteld. De Data Stations Policy geeft meer informatie over hoe DANS de toegankelijkheid en leesbaarheid van datasets waarborgt, en beschrijft de principes die DANS toepast bij het duurzaam bewaren van digitale onderzoeksdata. De volgende aspecten worden beschreven:

  • De gekozen aanpak voor het duurzaam archiveren van data.
  • De authenticiteit van de gegevens.
  • De verschillende stappen in het archiveringsproces, zoals het deponeren, duurzaam en veilig opslaan en beschikbaar stellen van gegevens, allemaal volgens het internationale referentiemodel voor een open archiefinformatiesysteem.

Na publicatie is je dataset beschikbaar in een eerste versie. Als je veranderingen wilt maken in de metadata of de inhoud van de dataset, dan kun je dit doen met de ‘Edit Dataset’ of ‘Upload Files’ knoppen. Vergeet niet om je veranderingen in te dienen via de ‘Submit’ knop: de aangepaste versie van je dataset wordt naar DANS verstuurd voor curatie en publicatie. 

Alle wijzingen van je dataset na publicatie leiden tot een nieuwe versie van de dataset. De PID blijft behouden en wordt samen met het versienummer weergegeven in de citatie. Wijzingen in de metadata leiden tot een minor version increment (van 1.0 naar 1.1), terwijl veranderingen in de bestanden van je dataset of in de toegangsvoorwaarde of licentie leiden tot een major version increment (van 1.0 naar 2.0). 

 

 

© DANS. R.5.3 Versie 1.4, 1 mei 2023