Veelgestelde vragen over de DANS Data Stations
Wat is een DANS Data Station?
De Data Stations zijn een dienst van DANS, het Nederlandse nationale expertisecentrum en repository voor onderzoeksdata. De focus van DANS ligt op het ondersteunen van onderzoekers in Nederland, om hen in staat te stellen hun data FAIR (Findable, Accessible, Interoperable en Reusable) te maken.
Een Data Station van DANS is een domeinspecifiek digitaal repository voor onderzoeksdata. Als je een onderzoeker bent of werkt bij een onderzoeksinstelling, dan kun je jouw data deponeren en zo archiveren voor de lange termijn. Je kunt data beschikbaar stellen voor hergebruik, of je kunt beperkingen stellen aan de toegang als ze gevoelige informatie bevatten. Alle gepubliceerde datasets zijn vindbaar via het DANS Data Station, waardoor anderen jouw onderzoek kunnen ontdekken.
DANS biedt data stations voor verschillende domeinen, om in de behoeften van specifieke wetenschappelijke gemeenschappen te voorzien: archeologische data kunnen worden gedeponeerd in het DANS Data Station Archaeology, data uit de sociale wetenschappen en de geesteswetenschappen in het DANS Data Station SSH. Data stations voor de Life, Health and Medical Sciences en Physical and Technical Sciences zullen ook beschikbaar komen.
Waarom zou ik mijn data deponeren in een DANS Data Station?
Door je data in een van de DANS Data Stations te deponeren, verzeker je je ervan dat jouw data voor de lange termijn worden bewaard en duurzaam worden gearchiveerd. Je kunt je data beschrijven met domeinspecifieke metadata om ervoor te zorgen dat ze goed zijn gedocumenteerd. Je kunt je data aan anderen beschikbaar maken voor hergebruik, maar je kunt er ook voor kiezen om de toegang te beperken, bijvoorbeeld als je dataset gevoelige informatie bevat. In alle gevallen zal de informatie die jouw data beschrijft (de metadata) openbaar beschikbaar zijn, zodat je onderzoek voor anderen vindbaar en zichtbaar is.
In tegenstelling tot repositories voor algemeen gebruik (zoals Zenodo), zijn de DANS Data Stations domeinspecifiek. DANS helpt jou je data te cureren volgens de standaarden van jouw domein, en deze duurzaam te archiveren. DANS biedt de diensten van de DANS Data Stations kosteloos aan (met bepaalde uitzonderingen), zonder commercieel oogmerk.
Wie kan data in een DANS Data Station deponeren?
Onderzoekers en onderzoeksgroepen kunnen hun data bij DANS in een data station deponeren. De DANS Data Stations kunnen ook worden gebruikt door onderzoeksinstellingen die hun data vindbaar en herbruikbaar willen maken. DANS is het Nederlandse nationale expertisecentrum en repository voor onderzoeksdata. En heeft een focus op de ondersteuning van onderzoekers in Nederland, om hen in staat te stellen hun data FAIR (Findable, Accessible, Interoperable en Reusable) te maken.
Als jouw organisatie deelneemt in DataverseNL, de repository-dienst voor universiteiten en andere onderzoeksinstellingen, dan kun je ook onderzoeksdata deponeren in de Dataverse van jouw organisatie. Meer informatie over DataverseNL vind je hier.
Welk DANS Data Station moet ik gebruiken als ik data wil deponeren of vinden die niet duidelijk tot één domein behoren?
Dat hangt af van de specifieke dataset waar het om gaat. DANS vraagt deposanten zelf vast te stellen welk data station het meest geschikt is voor de dataset die ze willen deponeren. Als je twijfels hebt over welk data station je het beste gebruikt, aarzel dan niet om advies te vragen. Voor gebruikers die datasets zoeken, is DANS bezig een functionaliteit te ontwikkelen die het mogelijk maakt in alle DANS Data Stations tegelijk te zoeken.
Zijn er kosten verbonden aan het gebruik van het DANS Data Station?
Data in een DANS Data Station deponeren is voor individuele onderzoekers kosteloos, voor datasets tot en met 50 GB. Voor grotere datasets kan DANS kosten in rekening brengen. Meer informatie vind je op deze pagina. Data downloaden van een DANS Data Station is altijd kosteloos.
Hoe kan ik data deponeren in een DANS Data Station?
DANS heeft voor de data stations een handleiding data deponeren opgesteld die je langs alle stappen leidt van het deponeren van data. Je kunt hier informatie vinden over waar je op moet letten voorafgaand aan, tijdens en na afloop van het deponeren. Hoe meer metadata, hoe beter jouw dataset vindbaar is.
Waar kan ik meer informatie vinden over de gebruiksvoorwaarden en het beleid die gelden voor de DANS Data Stations?
Door gebruik te maken van de DANS Data Stations, stem je in met de gebruiksvoorwaarden voor de DANS Data Stations die je hier kunt vinden (de DANS Data Stations Terms of Use, alleen in het Engels beschikbaar). Al het relevante beleid met betrekking tot de DANS Data Stations vind je hier (het DANS Data Stations Policy, alleen in het Engels beschikbaar).
Hebben de DANS Data Stations het CoreTrustSeal-keurmerk?
DANS heeft de procedure gestart om het CoreTrustSeal-keurmerk voor de DANS Data Stations te verkrijgen. Totdat het keurmerk is toegekend, worden alle data gedupliceerd in het EASY-archief, dat wel het CoreTrustSeal-keurmerk voert. Op die manier worden je data te allen tijde in een gecertificeerd repository bewaard.
Inloggen bij een DANS Data Station
Hoe kan ik inloggen bij het DANS Data Station?
De inlog pagina vind je hier (het DANS Data Station Archaeology), of hier (het DANS Data Station SSH). Op de homepage van het data station vind je rechtsboven op de pagina de ‘Log In’-knop. Je kunt je institutionele account (SURFconext) gebruiken, evenals je Github-account of je Google-account. Let wel: jouw institutionele account werkt vaak ook als een Google-account. Als je geen institutioneel account hebt, dan kun je jouw e-mailadres koppelen met eduID, inloggen via ‘Institutional Account’ en eduID selecteren. Als je in het verleden een dataset hebt gedeponeerd in EASY, dan zal je ook kunnen inloggen bij de DANS Data Stations met de gegevens van je EASY-account.
Ik ga naar een ander instituut – Kan ik mijn datasets blijven beheren?
Als je naar een ander instituut gaat en je data station account is gelinkt aan je institutioneel e-mailadres, blijft het account niet toegankelijk nadat je het instituut hebt verlaten. Bespreek met je instituut of de rechten voor het managen van je datasets bij jou als persoon kunnen blijven of overgedragen moeten worden aan een andere persoon binnen je instelling. Als je de datasets kan blijven managen kun je een nieuwe account aanmaken in het data station met een alternatieve e-mailadres (bijvoorbeeld je het e-mailadres van je nieuwe instelling). Neem contact op met DANS met een verzoek om managementrechten van je dataset toe te kennen aan het nieuwe account. Vermeld in je verzoek het oude e-mailadres, het nieuwe e-mailadres en de DOIs van de datasets die je verzoek betreft. Een van onze data managers zal contact met je opnemen om het verzoek verder af te handelen.
Kan ik een ander account management rechten geven over mijn dataset(s)?
DANS kan andere accounts bepaalde rechten geven over je datasets, zoals bijvoorbeeld het recht om de bestanden te bewerken of om toegangsverzoeken af te handelen (zie ook ‘Ik ga naar een ander instituut – Kan ik mijn datasets blijven beheren?’. Neem contact op met DANS en vermeld in je verzoek de reden van het overdragen van de rechten, alsook de relevante e-mailadressen en de DOIs van de datasets die je verzoek betreft. Een van onze data managers zal contact met je opnemen om het verzoek verder af te handelen.
Open Access en toegangsbeperkingen
Moet ik mijn data Open Access publiceren?
Nee. Je kunt verschillende toegangscategorieën kiezen voor je dataset. De DANS Data Stations bieden de mogelijkheid om data Open Access te publiceren, of om de toegang tot alle of sommige bestanden in je dataset te beperken. DANS adviseert data zo open als mogelijk te publiceren, maar zo gesloten als vereist. Als je ervoor kiest om toegang tot een dataset te beperken, dan kun je instellen dat gebruikers toegang tot de data kunnen aanvragen door middel van een toegangsverzoek. Jij zal deze gebruikers dan toestemming moeten geven voordat zij toegang krijgen tot jouw data.
Het is ook mogelijk om toegang tot een dataset te beperken zonder toegangsverzoeken toe te staan – de bestanden zijn dan niet toegankelijk voor welke gebruiker van een data station dan ook, maar ze worden nog steeds gearchiveerd en bewaard voor de lange termijn.
Informatie over de opties voor toegangsbeperking kun je vinden in de handleiding voor tijdens het deponeren.
Kan ik toegang tot specifieke bestanden beperken?
Ja. Je kunt de toegang tot specifieke bestanden in een dataset beperken, terwijl andere bestanden in dezelfde dataset open toegankelijk blijven. Let wel: een toegangsverzoek betreft altijd de gehele dataset. Dat houdt in dat als het toegangsverzoek van een gebruiker is ingewilligd, deze gebruiker toegang zal hebben tot alle bestanden met beperkte toegang. Als je in jouw situatie de toegang tot sommige bestanden geheel zou willen beperken, terwijl andere bestanden na een toegangsverzoek toegankelijk moeten kunnen worden, neem dan contact op met een van de Data Station Managers. Zij zullen meedenken over wat in jouw geval de meest geschikte oplossing is.
Welke licenties kan ik kiezen voor mijn data?
De DANS Data Stations bieden verschillende licenties waaruit je kunt kiezen voor je dataset. DANS beveelt aan data zo open mogelijk te publiceren wanneer je een dataset deponeert. De standaard licentie die datasets krijgen is de CC0 1.0 licentie. Je kunt dit wijzigen naar een andere Creative Commons licentie voor Open Access datasets. Voor een beperkt toegankelijke dataset is het gebruik ervan altijd onderworpen aan de DANS Licentie. Let wel: de licentie kies je voor de dataset als geheel, en deze geldt voor alle bestanden in de dataset.
Meer informatie over de licenties die DANS aanbiedt, kun je vinden in de deponeerhandleiding.
Kan ik de licentie of de toegangsbeperkingen van mijn dataset wijzigen nadat deze is gepubliceerd?
Het is mogelijk de licentie of toegangsbeperkingen van een dataset te wijzigen. Wijzigingen naar een meer open licentie en minder toegangsbeperkingen zijn altijd toegestaan. Als je echter wilt wijzigen naar een meer gesloten licentie of de toegang tot je bestanden wilt inperken, neem dan contact op met DANS om de situatie te bespreken. Veranderingen van de licentie en/of de toegangsbeperkingen leiden altijd tot een nieuwe versie van de dataset. Je moet deze nieuwe versie indienen bij het Data Processing Team van DANS, dat de nieuwe versie zal cureren en publiceren.
Hoe word ik op de hoogte gesteld van een toegangsverzoek voor mijn dataset en hoe handel ik het verzoek af?
Als een gebruiker toegang tot een dataset heeft aangevraagd, wordt automatisch een e-mail naar je toegestuurd. De boodschap bevat een link naar de pagina waar je toegang tot de bestanden kunt verlenen of weigeren. Je kunt deze pagina ook vinden door onder ‘MyData’ de juiste dataset te selecteren, en dan te gaan naar de ‘Edit Dataset>Permissions>File’ pagina. Op deze pagina vind je alle uitstaande verzoeken en kun je toegang verlenen of weigeren. Een gebruiker zal bericht krijgen, in de vorm van een e-mail, zodra het verzoek is afgehandeld.
Let wel: het is aan te bevelen toegangsverzoeken zo snel mogelijk af te handelen, op zijn minst binnen de maximale termijn gespecificeerd in de gebruiksvoorwaarden.
Ik wil graag weten waarom een gebruiker toegang wil tot mijn data. Kunnen gebruikers een motivatie toevoegen?
Helaas is het op dit moment in ons systeem niet mogelijk dat gebruikers die een toegangsverzoek indienen hun motivatie hier direct aan toevoegen. Als je informatie over de motivatie van gebruikers nodig hebt om de toegangsverzoeken te evalueren, kun je dit opgeven in het veld ‘Terms of Access for Restricted Files’ dat je kunt vinden in het ‘Terms’ vakje. Hier kun je bijvoorbeeld aangeven dat gebruikers hun motivatie per e-mail moeten sturen voordat hun toegangsverzoek goedgekeurd kan worden. De Terms of Access worden expliciet getoond aan de gebruikers bij het indienen van een toegangsverzoek tot de data.
Datasets deponeren met persoonsgegevens of gevoelige informatie
Kan ik datasets deponeren die persoonsgegevens bevatten?
Ja, datasets met persoonsgegevens kun je deponeren in het DANS Data Station. Het is echter zaak je rekenschap te geven van enkele bijkomende overwegingen als jouw dataset persoonsgegevens bevat. Je hebt bijvoorbeeld informed consent nodig van de deelnemers aan het onderzoek. Je zal misschien ook je dataset willen publiceren met beperkte toegang. Dat betekent dat je gebruikers toestemming moet verlenen voordat zij de data kunnen gebruiken. De handleiding ‘Tijdens het deponeren’ biedt meer informatie over het bewaren van persoonsgegevens en de zaken die je daarbij in overweging moet nemen.
Moet ik datasets met persoonsgegevens anonimiseren, pseudonimiseren of versleutelen?
Je bent zelf verantwoordelijk voor maatregelen die persoonsgegevens beschermen op een manier die past bij jouw specifieke situatie. Als anonimiseren van de gegevens onmogelijk is, kun je ervoor kiezen om data te pseudonimiseren of te versleutelen. In het geval van versleuteling is het belangrijk dat je de sleutel elders bewaart, op een veilige en duurzame manier. De handleiding ‘Tijdens het deponeren’ biedt meer informatie over het bewaren van persoonsgegevens en de zaken die je daarbij in overweging moet nemen.
Kan ik mijn informed consent-formulieren bewaren bij DANS?
Nee, informed consent-formulieren die zijn ondertekend door deelnemers aan het onderzoek kunnen niet samen met de data worden bewaard. De deelnemers zouden dan het risico lopen dat ze worden geïdentificeerd. Zorg ervoor dat deze informatie ergens anders wordt bewaard.
Ik werk met erg gevoelige data die ik niet mag delen. Kan ik de overige projectinformatie bij DANS deponeren?
In speciale gevallen staat DANS toe alleen de metadata en documentatie te publiceren zodat een project beschikbaar blijft en ernaar kan worden verwezen op een duurzame manier. Neem voor meer informatie contact op met een van de Data Station Managers.
Bestandsformaten en metadata
Welke bestandsformaten en metadata kan ik aanleveren?
DANS werkt met voorkeursformaten. Lees hier meer. Per domein zijn specifieke aanleverspecificaties van toepassing. Lees hier meer.
Ik heb audiovisueel materiaal. Kan ik dat bewaren bij DANS?
Ja, je kunt jouw audiovisuele materiaal deponeren in het DANS Data Station. De data stations bieden ook een viewer waarmee gebruikers het materiaal kunnen bekijken, vooropgesteld dat ze toegang hebben tot de dataset en dat het bestandsformaat wordt ondersteund. Bestandsformaten die worden ondersteund zijn mp3, mpeg, wav, ogg, en m4a voor audiobestanden; en mp4, ogg, en QuickTime voor videobestanden.
Let wel: de maximale omvang bij het deponeren is momenteel 9,3 GB per bestand. Neem contact op met een van de Data Station Managers als jouw bestanden groter zijn of als je problemen ondervindt tijdens het uploaden van een groot bestand. Informatie over voorkeursformaten voor audiovisueel materiaal kun je hier vinden.
Kan ik CMDI metadata toevoegen aan mijn dataset?
Als je een dataset deponeert in het DANS Data Station SSH, dan kun je CMDI metadata toevoegen in een apart XML-bestand. Wanneer je metadata invoert, geef je aan dat jouw dataset CMDI-bestanden bevat door deze dataset toe te voegen aan de CLARIN-collectie die in het DANS Data Station SSH al te vinden is. De CLARIN-collectie geeft gebruikers toegang tot alle datasets in het Data Station SSH die CMDI-metadata hebben.
Hoe worden statistische data (SPSS, STATA) gearchiveerd bij DANS?
De beste manier om statistische data duurzaam te bewaren is door de data en de documentatie in ASCII-formaat op te slaan. Om deze reden worden statistische bestanden van commerciële softwarepakketten zoals SPSS of STATA door DANS omgezet naar een open bestandsformaat. In het verleden heeft DANS bestanden omgezet door middel van de Stattransfer software. Deze software biedt de mogelijkheid om SPSS bestanden (.sav) en STATA bestanden (.dta) om te zetten naar setup bestanden (.dat en .sps voor SPSS; .dat en .DO voor STATA). In ons Data Station worden statistische bestanden automatisch omgezet door de Dataverse software. Dataverse zet tabulaire data, zoals SPSS bestanden en andere statistische bestanden, automatisch om in TAB-bestanden. De metadata die de inhoud van de databestanden beschrijven wordt bewaard in een XML-bestand. Samen kan deze informatie ingelezen worden in SPSS of STATA en andere applicaties waardoor de data makkelijk herbruikbaar wordt voor anderen.
Waarom zie ik .tab-bestanden in mijn dataset?
Als je tabulaire data uploadt in het data station, zet Dataverse dit bestand automatisch om in een open formaat, een TAB-bestand (zie ook ‘Hoe worden statistische data (SPSS, STATA) gearchiveerd bij DANS?’). Daardoor zullen in je bestandsoverzicht TAB-bestanden te zien zijn (bijv. ‘Data.sav’ zal in het overzicht worden opgenomen als ‘Data.tab’). In Dataverse kun je bestanden zowel downloaden in het omgezette formaat, als in het oorspronkelijke formaat.
Als je dataset twee statistische bestanden bevat met dezelfde naam maar verschillende extensies (bijv. ‘Data.sav’ en ‘Data.dta’), dan zullen beide bestanden als .tab-bestanden worden getoond om jouw bestandsoverzicht. Dataverse zal dan een nummer toevoegen aan de bestandsnaam om ervoor te zorgen dat er niet twee bestanden zijn met dezelfde naam en extensie (zo zul je bijv. ‘Data.tab’ en ‘Data-1.tab’).
De overgang van DANS-EASY naar de DANS Data Stations
Welke nieuwe mogelijkheden bieden de DANS Data Stations ten opzichte van hun voorganger EASY?
De DANS Data Stations bieden veel nieuwe mogelijkheden die de gebruikerservaring bij zowel het deponeren als het vinden van data verbeteren. Alle nieuwe mogelijkheden zijn te vinden in dit overzicht.
Wat zijn de verschillen tussen de gebruiksvoorwaarden van de DANS Data Stations en hun voorganger EASY?
De DANS Data Stations hebben andere gebruiksvoorwaarden dan EASY. In dit overzicht vind je de belangrijkste verschillen tussen de overeenkomsten die van toepassing zijn.
Kan ik mijn EASY-account gebruiken om in te loggen bij een DANS Data Station?
Als je in het verleden een dataset hebt gedeponeerd in EASY, dan zal je ook kunnen inloggen bij de DANS Data Stations met de gegevens van de EASY-account. Let wel: de accounts voor het DANS Data Station SSH zijn gemigreerd vanuit EASY in februari 2023. Als je sindsdien in EASY je wachtwoord hebt gewijzigd, dan zul je een nieuw wachtwoord moeten aanvragen om op een data station in te kunnen loggen.
Als je een EASY-account hebt zonder dat je een dataset hebt gepubliceerd, dan is je account niet gemigreerd en zul je een van de andere mogelijkheden moeten kiezen om in te loggen. Zie ‘Hoe kan ik inloggen bij het DANS Data Station?’.
Wat gebeurt er met toegangsverzoeken voor datasets in EASY met beperkte toegang, nadat de dataset is verplaatst naar het DANS Data Station?
Eerder in EASY verleende toegang tot datasets is niet meegekomen in de migratie naar de DANS Data Stations. Een nieuw toegangsverzoek moet worden ingediend en afgehandeld in een data station om toegang te verlenen tot een dataset met beperkte toegang. Informatie over het hergebruik van data en het aanvragen van toegang is te vinden in de handleiding ‘Hergebruik van data’.
Waarom is mijn SSH-dataset nog niet gemigreerd van EASY naar het DANS Data Station SSH?
DANS is bezig alle sociaal- en geesteswetenschappelijke datasets die in EASY worden bewaard, te migreren naar het DANS Data Station SSH. Voor sommige datasets neemt dit proces meer tijd in beslag dan voor andere, bijvoorbeeld vanwege de omvang of de complexiteit van de datasets. Het is daarom mogelijk dat de metadata van jouw dataset al wel beschikbaar zijn in het DANS Data Station SSH maar dat toegang tot de data nog plaatsvindt via de EASY-omgeving. In dat geval bevatten de metadata van jouw dataset in het DANS Data Station SSH een link naar jouw data in EASY. De komende maanden zal deze situatie worden opgelost.