Veelgestelde vragen over de DANS Data Stations

Wat is een DANS Data Station?
De Data Stations zijn een dienst van DANS, het Nederlandse nationale expertisecentrum en repository voor onderzoeksdata. De focus van DANS ligt op het ondersteunen van onderzoekers in Nederland, om hen in staat te stellen hun data FAIR (Findable, Accessible, Interoperable en Reusable) te maken.

Een Data Station van DANS is een domeinspecifiek digitaal repository voor onderzoeksdata. Als je een onderzoeker bent of werkt bij een onderzoeksinstelling, dan kun je jouw data deponeren en zo archiveren voor de lange termijn. Je kunt data beschikbaar stellen voor hergebruik, of je kunt beperkingen stellen aan de toegang als ze gevoelige informatie bevatten. Alle gepubliceerde datasets zijn vindbaar via het DANS Data Station, waardoor anderen jouw onderzoek kunnen ontdekken.

DANS biedt data stations voor verschillende domeinen, om in de behoeften van specifieke wetenschappelijke gemeenschappen te voorzien:
– Archeologische data kunnen worden gedeponeerd in het DANS Data Station Archaeology,
– Data uit de sociale wetenschappen en de geesteswetenschappen in het
DANS Data Station SSH,
Data uit de Medische, Gezondheids- en Groene Levenswetenschappen kunnen worden gedeponeerd DANS Data Station Life Sciences,
– Het DANS Data Station Physical and Technical Sciences kan worden gebruikt om onderzoeksdata uit het fysische en technische domein te deponeren. 

Waarom zou ik mijn data deponeren in een DANS Data Station?
Door je data in een van de DANS Data Stations te deponeren, verzeker je je ervan dat jouw data voor de lange termijn worden bewaard en duurzaam worden gearchiveerd. Je kunt je data beschrijven met domeinspecifieke metadata om ervoor te zorgen dat ze goed zijn gedocumenteerd. Je kunt je data aan anderen beschikbaar maken voor hergebruik, maar je kunt er ook voor kiezen om de toegang te beperken, bijvoorbeeld als je dataset gevoelige informatie bevat. In alle gevallen zal de informatie die jouw data beschrijft (de metadata) openbaar beschikbaar zijn, zodat je onderzoek voor anderen vindbaar en zichtbaar is.

In tegenstelling tot repositories voor algemeen gebruik (zoals Zenodo), zijn de DANS Data Stations domeinspecifiek. DANS helpt jou je data te cureren volgens de standaarden van jouw domein, en deze duurzaam te archiveren. DANS biedt de diensten van de DANS Data Stations kosteloos aan (met bepaalde uitzonderingen), zonder commercieel oogmerk. 

Wie kan data in een DANS Data Station deponeren?
Onderzoekers en onderzoeksgroepen kunnen hun data bij DANS in een data station deponeren. De DANS Data Stations kunnen ook worden gebruikt door onderzoeksinstellingen die hun data vindbaar en herbruikbaar willen maken. DANS is het Nederlandse nationale expertisecentrum en repository voor onderzoeksdata. En heeft een focus op de ondersteuning van onderzoekers in Nederland, om hen in staat te stellen hun data FAIR (Findable, Accessible, Interoperable en Reusable) te maken.

Als jouw organisatie deelneemt in DataverseNL, de repository-dienst voor universiteiten en andere onderzoeksinstellingen, dan kun je ook onderzoeksdata deponeren in de Dataverse van jouw organisatie. Meer informatie over DataverseNL vind je hier. 

Welk DANS Data Station moet ik gebruiken als ik data wil deponeren of vinden die niet duidelijk tot één domein behoren?
Dat hangt af van de specifieke dataset waar het om gaat. DANS vraagt deposanten zelf vast te stellen welk data station het meest geschikt is voor de dataset die ze willen deponeren. Als je twijfels hebt over welk data station je het beste gebruikt, aarzel dan niet om advies te vragen. Voor gebruikers die datasets zoeken, is DANS bezig een functionaliteit te ontwikkelen die het mogelijk maakt in alle DANS Data Stations tegelijk te zoeken. 

Zijn er kosten verbonden aan het gebruik van het DANS Data Station?
Data in een DANS Data Station deponeren is voor individuele onderzoekers kosteloos, voor datasets tot en met 50 GB. Voor grotere datasets kan DANS kosten in rekening brengen. Meer informatie vind je op deze pagina. Data downloaden van een DANS Data Station is altijd kosteloos.

Hoe kan ik data deponeren in een DANS Data Station?
DANS heeft voor de data stations een handleiding data deponeren opgesteld die je langs alle stappen leidt van het deponeren van data. Je kunt hier informatie vinden over waar je op moet letten voorafgaand aan, tijdens en na afloop van het deponeren. Hoe meer metadata, hoe beter jouw dataset vindbaar is.

Waar kan ik meer informatie vinden over de gebruiksvoorwaarden en het beleid die gelden voor de DANS Data Stations?
Door gebruik te maken van de DANS Data Stations, stem je in met de gebruiksvoorwaarden voor de DANS Data Stations die je hier kunt vinden (de DANS Data Stations Terms of Use, alleen in het Engels beschikbaar). Al het relevante beleid met betrekking tot de DANS Data Stations vind je hier (het DANS Data Stations Policy, alleen in het Engels beschikbaar).

Hebben de DANS Data Stations het CoreTrustSeal-keurmerk?
DANS heeft de procedure gestart om het CoreTrustSeal-keurmerk voor de DANS Data Stations te verkrijgen. Totdat het keurmerk is toegekend, worden alle data gedupliceerd in het EASY-archief, dat wel het CoreTrustSeal-keurmerk voert. Op die manier worden je data te allen tijde in een gecertificeerd repository bewaard.

Inloggen bij een DANS Data Station

Hoe kan ik inloggen bij het DANS Data Station?
Hieronder vind je de inlogpagina’s van de volgende DANS Data Stations:
DANS Data Station Archaeology,
DANS Data Station SSH,
DANS Data Station Life Sciences,
DANS Data Station Physical and Technical Sciences.
Op de homepages van het data stations vind je rechtsboven op de pagina de ‘Log In’-knop. Je kunt je institutionele account (SURFconext) gebruiken, evenals je Github-account of je Google-account. Let wel: jouw institutionele account werkt vaak ook als een Google-account. Als je geen institutioneel account hebt, dan kun je jouw e-mailadres koppelen met eduID, inloggen via ‘Institutional Account’ en eduID selecteren. Als je in het verleden een dataset hebt gedeponeerd in EASY, dan zal je ook kunnen inloggen bij de DANS Data Stations met de gegevens van je EASY-account. 

Ik ga naar een ander instituut – Kan ik mijn datasets blijven beheren?
Als je naar een ander instituut gaat en je data station account is gelinkt aan je institutioneel e-mailadres, blijft het account niet toegankelijk nadat je het instituut hebt verlaten. Bespreek met je instituut of de rechten voor het managen van je datasets bij jou als persoon kunnen blijven of overgedragen moeten worden aan een andere persoon binnen je instelling. Als je de datasets kan blijven managen kun je een nieuwe account aanmaken in het data station met een alternatieve e-mailadres (bijvoorbeeld je het e-mailadres van je nieuwe instelling). Neem contact op met DANS met een verzoek om managementrechten van je dataset toe te kennen aan het nieuwe account. Vermeld in je verzoek het oude e-mailadres, het nieuwe e-mailadres en de DOIs van de datasets die je verzoek betreft. Een van onze data managers zal contact met je opnemen om het verzoek verder af te handelen. 

Kan ik een ander account management rechten geven over mijn dataset(s)?
DANS kan andere accounts bepaalde rechten geven over je datasets, zoals bijvoorbeeld het recht om de bestanden te bewerken of om toegangsverzoeken af te handelen (zie ook ‘Ik ga naar een ander instituut – Kan ik mijn datasets blijven beheren?’. Neem contact op met DANS en vermeld in je verzoek de reden van het overdragen van de rechten, alsook de relevante e-mailadressen en de DOIs van de datasets die je verzoek betreft.  Een van onze data managers zal contact met je opnemen om het verzoek verder af te handelen.

Open Access en toegangsbeperkingen

Moet ik mijn data Open Access publiceren?
Nee. Je kunt verschillende toegangscategorieën kiezen voor je dataset. De DANS Data Stations bieden de mogelijkheid om data Open Access te publiceren, of om de toegang tot alle of sommige bestanden in je dataset te beperken. DANS adviseert data zo open als mogelijk te publiceren, maar zo gesloten als vereist.

Als je ervoor kiest om toegang tot een dataset te beperken, dan kun je instellen dat gebruikers toegang tot de data kunnen aanvragen door middel van een toegangsverzoek. Jij zal deze gebruikers dan toestemming moeten geven voordat zij toegang krijgen tot jouw data.

Het is ook mogelijk om toegang tot een dataset te beperken zonder toegangsverzoeken toe te staan – de bestanden zijn dan niet toegankelijk voor welke gebruiker van een data station dan ook, maar ze worden nog steeds gearchiveerd en bewaard voor de lange termijn.

Informatie over de opties voor toegangsbeperking kun je vinden in de handleiding voor tijdens het deponeren. 

Kan ik toegang tot specifieke bestanden beperken?
Ja. Je kunt de toegang tot specifieke bestanden in een dataset beperken, terwijl andere bestanden in dezelfde dataset open toegankelijk blijven. Let wel: een toegangsverzoek betreft altijd de gehele dataset. Dat houdt in dat als het toegangsverzoek van een gebruiker is ingewilligd, deze gebruiker toegang zal hebben tot alle bestanden met beperkte toegang. Als je in jouw situatie de toegang tot sommige bestanden geheel zou willen beperken, terwijl andere bestanden na een toegangsverzoek toegankelijk moeten kunnen worden, neem dan contact op met een van de Data Station Managers. Zij zullen meedenken over wat in jouw geval de meest geschikte oplossing is.

Welke licenties kan ik kiezen voor mijn data?
De DANS Data Stations bieden verschillende licenties waaruit je kunt kiezen voor je dataset. DANS beveelt aan data zo open mogelijk te publiceren wanneer je een dataset deponeert. De standaard licentie die datasets krijgen is de CC0 1.0 licentie. Je kunt dit wijzigen naar een andere Creative Commons licentie voor Open Access datasets. Voor een beperkt toegankelijke dataset is het gebruik ervan altijd onderworpen aan de DANS Licentie. Let wel: de licentie kies je voor de dataset als geheel, en deze geldt voor alle bestanden in de dataset.

Meer informatie over de licenties die DANS aanbiedt, kun je vinden in de deponeerhandleiding. 

Kan ik de licentie of de toegangsbeperkingen van mijn dataset wijzigen nadat deze is gepubliceerd?
Het is mogelijk de licentie of toegangsbeperkingen van een dataset te wijzigen. Wijzigingen naar een meer open licentie en minder toegangsbeperkingen zijn altijd toegestaan. Als je echter wilt wijzigen naar een meer gesloten licentie of de toegang tot je bestanden wilt inperken, neem dan contact op met DANS om de situatie te bespreken. Veranderingen van de licentie en/of de toegangsbeperkingen leiden altijd tot een nieuwe versie van de dataset. Je moet deze nieuwe versie indienen bij het Data Processing Team van DANS, dat de nieuwe versie zal cureren en publiceren.  

Hoe word ik op de hoogte gesteld van een toegangsverzoek voor mijn dataset en hoe handel ik het verzoek af?
Als een gebruiker toegang tot een dataset heeft aangevraagd, wordt automatisch een e-mail naar je toegestuurd. De boodschap bevat een link naar de pagina waar je toegang tot de bestanden kunt verlenen of weigeren. Je kunt deze pagina ook vinden door onder ‘MyData’ de juiste dataset te selecteren, en dan te gaan naar de ‘Edit Dataset>Permissions>File’ pagina. Op deze pagina vind je alle uitstaande verzoeken en kun je toegang verlenen of weigeren. Een gebruiker zal bericht krijgen, in de vorm van een e-mail, zodra het verzoek is afgehandeld.

Let wel: het is aan te bevelen toegangsverzoeken zo snel mogelijk af te handelen, op zijn minst binnen de maximale termijn gespecificeerd in de gebruiksvoorwaarden. 

Ik wil graag weten waarom een gebruiker toegang wil tot mijn data. Kunnen gebruikers een motivatie toevoegen?
Helaas is het op dit moment in ons systeem niet mogelijk dat gebruikers die een toegangsverzoek indienen hun motivatie hier direct aan toevoegen. Als je informatie over de motivatie van gebruikers nodig hebt om de toegangsverzoeken te evalueren, kun je dit opgeven in het veld ‘Terms of Access for Restricted Files’ dat je kunt vinden in het ‘Terms’ vakje. Hier kun je bijvoorbeeld aangeven dat gebruikers hun motivatie per e-mail moeten sturen voordat hun toegangsverzoek goedgekeurd kan worden. De Terms of Access worden expliciet getoond aan de gebruikers bij het indienen van een toegangsverzoek tot de data. 

Datasets deponeren met persoonsgegevens of gevoelige informatie

Kan ik datasets deponeren die persoonsgegevens bevatten?
Ja, datasets met persoonsgegevens kun je deponeren in het DANS Data Station. Het is echter zaak je rekenschap te geven van enkele bijkomende overwegingen als jouw dataset persoonsgegevens bevat. Je hebt bijvoorbeeld informed consent nodig van de deelnemers aan het onderzoek. Je zal misschien ook je dataset willen publiceren met beperkte toegang. Dat betekent dat je gebruikers toestemming moet verlenen voordat zij de data kunnen gebruiken. De handleiding ‘Tijdens het deponeren’ biedt meer informatie over het bewaren van persoonsgegevens en de zaken die je daarbij in overweging moet nemen. 

Moet ik datasets met persoonsgegevens anonimiseren, pseudonimiseren of versleutelen?
Je bent zelf verantwoordelijk voor maatregelen die persoonsgegevens beschermen op een manier die past bij jouw specifieke situatie. Als anonimiseren van de gegevens onmogelijk is, kun je ervoor kiezen om data te pseudonimiseren of te versleutelen. In het geval van versleuteling is het belangrijk dat je de sleutel elders bewaart, op een veilige en duurzame manier. De handleiding ‘Tijdens het deponeren’ biedt meer informatie over het bewaren van persoonsgegevens en de zaken die je daarbij in overweging moet nemen. 

Kan ik mijn informed consent-formulieren bewaren bij DANS?
Nee, informed consent-formulieren die zijn ondertekend door deelnemers aan het onderzoek kunnen niet samen met de data worden bewaard. De deelnemers zouden dan het risico lopen dat ze worden geïdentificeerd. Zorg ervoor dat deze informatie ergens anders wordt bewaard. 

Ik werk met erg gevoelige data die ik niet mag delen. Kan ik de overige projectinformatie bij DANS deponeren?
In speciale gevallen staat DANS toe alleen de metadata en documentatie te publiceren zodat een project beschikbaar blijft en ernaar kan worden verwezen op een duurzame manier. Neem voor meer informatie contact op met een van de Data Station Managers. 

Bestandsformaten en metadata

Welke bestandsformaten en metadata kan ik aanleveren?
DANS werkt met voorkeursformaten. Lees hier meer. Per domein zijn specifieke aanleverspecificaties van toepassing. Lees hier meer. 

Ik heb audiovisueel materiaal. Kan ik dat bewaren bij DANS?
Ja, je kunt jouw audiovisuele materiaal deponeren in het DANS Data Station. De data stations bieden ook een viewer waarmee gebruikers het materiaal kunnen bekijken, vooropgesteld dat ze toegang hebben tot de dataset en dat het bestandsformaat wordt ondersteund. Bestandsformaten die worden ondersteund zijn mp3, mpeg, wav, ogg, en m4a voor audiobestanden; en mp4, ogg, en QuickTime voor videobestanden.

Let wel: de maximale omvang bij het deponeren is momenteel 9,3 GB per bestand. Neem contact op met een van de Data Station Managers als jouw bestanden groter zijn of als je problemen ondervindt tijdens het uploaden van een groot bestand. Informatie over voorkeursformaten voor audiovisueel materiaal kun je hier vinden. 

Kan ik CMDI metadata toevoegen aan mijn dataset?
Als je een dataset deponeert in het DANS Data Station SSH, dan kun je CMDI metadata toevoegen in een apart XML-bestand. Wanneer je metadata invoert, geef je aan dat jouw dataset CMDI-bestanden bevat door deze dataset toe te voegen aan de CLARIN-collectie die in het DANS Data Station SSH al te vinden is. De CLARIN-collectie geeft gebruikers toegang tot alle datasets in het Data Station SSH die CMDI-metadata hebben.

Hoe worden statistische data (SPSS, STATA) gearchiveerd bij DANS?
De beste manier om statistische data duurzaam te bewaren is door de data en de documentatie in ASCII-formaat op te slaan. Om deze reden worden statistische bestanden van commerciële softwarepakketten zoals SPSS of STATA door DANS omgezet naar een open bestandsformaat.

In het verleden heeft DANS bestanden omgezet door middel van de Stattransfer software. Deze software biedt de mogelijkheid om SPSS bestanden (.sav) en STATA bestanden (.dta) om te zetten naar setup bestanden (.dat en .sps voor SPSS; .dat en .DO voor STATA). In ons Data Station worden statistische bestanden automatisch omgezet door de Dataverse software. Dataverse zet tabulaire data, zoals SPSS bestanden en andere statistische bestanden, automatisch om in TAB-bestanden. De metadata die de inhoud van de databestanden beschrijven wordt bewaard in een XML-bestand. Samen kan deze informatie ingelezen worden in SPSS of STATA en andere applicaties waardoor de data makkelijk herbruikbaar wordt voor anderen.  

Waarom zie ik .tab-bestanden in mijn dataset?
Als je tabulaire data uploadt in het data station, zet Dataverse dit bestand automatisch om in een open formaat, een TAB-bestand (zie ook ‘Hoe worden statistische data (SPSS, STATA) gearchiveerd bij DANS?’). Daardoor zullen in je bestandsoverzicht TAB-bestanden te zien zijn (bijv. ‘Data.sav’ zal in het overzicht worden opgenomen als ‘Data.tab’). In Dataverse kun je bestanden zowel downloaden in het omgezette formaat, als in het oorspronkelijke formaat.
Als je dataset twee statistische bestanden bevat met dezelfde naam maar verschillende extensies (bijv. ‘Data.sav’ en ‘Data.dta’), dan zullen beide bestanden als .tab-bestanden worden getoond om jouw bestandsoverzicht. Dataverse zal dan een nummer toevoegen aan de bestandsnaam om ervoor te zorgen dat er niet twee bestanden zijn met dezelfde naam en extensie (zo zul je bijv. ‘Data.tab’ en ‘Data-1.tab’). 

Er zijn veel verschillende datumvelden in het blok met Citation Metadata: Publication Date, Production Date, Distribution Date, Collection Date, Deposit Date. Wat is de betekenis van deze datumvelden?
De betekenis van de verschillende soorten datumvelden in de Citation Metadata is in principe als volgt (dit overzicht houdt ruwweg de volgorde van het onderzoeksproces aan, terwijl in de Citation Metadata deze datumvelden in een andere volgorde verschijnen):

  • Date of Collection: de datum, of datums, waarop de gegevens in een dataset zijn verzameld, voor onderzoeksdoeleinden of anderszins. 
  • Production Date: de datum waarop uit de verzamelde gegevens de dataset is samengesteld.
  • Deposit Date:  de datum waarop de deposant de dataset heeft ingediend voor curatie en publicatie door DANS. 
  • Publication Date: de datum waarop de dataset het curatieproces heeft doorlopen en is gepubliceerd in een DANS Data Station.
  • Distribution Date: de datum waarop een reeds gepubliceerde dataset beschikbaar wordt gemaakt, om te worden geraadpleegd of hergebruikt (bijv. na afloop van een embargoperiode).

Van deze datums, worden de Deposit Date en de Publication Date automatisch gegenereerd door de DANS Data Stations, en niet handmatig ingesteld door de deposant. De Publication Date is de datum die wordt gebruikt bij het citeren van een dataset. De Publication Date is daarom heel belangrijk om op een correcte manier in een publicatie naar een dataset te verwijzen. 

Naast deze datumvelden, zijn er nog twee metadata-elementen, die een datum of tijdsperiode aanduiden:

  • Time Period, met Start Date en End Date (onderdeel van de Citation Metadata): deze data definiëren de periode die onderwerp is van de onderzoeksgegevens, zoals wanneer de gegevens bijvoorbeeld verwijzen naar een bepaalde periode in de geschiedenis. 
  • Temporal Coverage (deel van Temporal and Spatial Coverage): dit is, opnieuw, de de periode die de data als onderwerp hebben, maar in dit geval wordt de waarde van het veld ingevuld in vrije tekst in plaats van in specifieke datums. Daarmee zijn waarden als, bijvoorbeeld, ‘Renaissance’ of ‘Coronapandemie’ toegestaan.

NOTA BENE: Vanwege de overgang van EASY naar de DANS Data Stations zijn er op de bovenstaande definities van de datumvelden enkele uitzonderingen, geïmporteerd vanuit EASY naar de Data Stations. Dit is het geval voor veel datasets in het Data Station Archaeology, evenals voor bepaalde datasets in het Data Station Social Sciences and Humanities die betrekking hebben op historische volkstellingen. Voor deze datasets verwijst de Publication Date namelijk naar de datum van publicatie van het oorspronkelijke (papieren) rapport dat de gegevens bevatte (in EASY was dit Date Created), niet naar de datum van publicatie van de dataset bij DANS. Als gevolg hiervan is het mogelijk dat de Publication Date (de datum van publicatie van het oorspronkelijke rapport) van deze datasets vroeger ligt dan de Deposit Date (de datum waarop de dataset is ingediend bij DANS, om te worden gepubliceerd).

 

De overgang van DANS-EASY naar de DANS Data Stations

Welke nieuwe mogelijkheden bieden de DANS Data Stations ten opzichte van hun voorganger EASY?
De DANS Data Stations bieden veel nieuwe mogelijkheden die de gebruikerservaring bij zowel het deponeren als het vinden van data verbeteren. Alle nieuwe mogelijkheden zijn te vinden in dit overzicht.  

Wat zijn de verschillen tussen de gebruiksvoorwaarden van de DANS Data Stations en hun voorganger EASY?
De DANS Data Stations hebben andere gebruiksvoorwaarden dan EASY. In dit overzicht vind je de belangrijkste verschillen tussen de overeenkomsten die van toepassing zijn. 

Kan ik mijn EASY-account gebruiken om in te loggen bij een DANS Data Station?
Als je in het verleden een dataset hebt gedeponeerd in EASY, dan zal je ook kunnen inloggen bij de DANS Data Stations met de gegevens van de EASY-account. Let wel: de accounts voor het DANS Data Station SSH zijn gemigreerd vanuit EASY in februari 2023. Als je sindsdien in EASY je wachtwoord hebt gewijzigd, dan zul je een nieuw wachtwoord moeten aanvragen om op een data station in te kunnen loggen.

Als je een EASY-account hebt zonder dat je een dataset hebt gepubliceerd, dan is je account niet gemigreerd en zul je een van de andere mogelijkheden moeten kiezen om in te loggen. Zie ‘Hoe kan ik inloggen bij het DANS Data Station?’. 

Wat gebeurt er met toegangsverzoeken voor datasets in EASY met beperkte toegang, nadat de dataset is verplaatst naar het DANS Data Station?
Eerder in EASY verleende toegang tot datasets is niet meegekomen in de migratie naar de DANS Data Stations. Een nieuw toegangsverzoek moet worden ingediend en afgehandeld in een data station om toegang te verlenen tot een dataset met beperkte toegang. Informatie over het hergebruik van data en het aanvragen van toegang is te vinden in de handleiding ‘Hergebruik van data’. 

Waarom is mijn SSH-dataset nog niet gemigreerd van EASY naar het DANS Data Station SSH?
DANS is bezig alle sociaal- en geesteswetenschappelijke datasets die in EASY worden bewaard, te migreren naar het DANS Data Station SSH. Voor sommige datasets neemt dit proces meer tijd in beslag dan voor andere, bijvoorbeeld vanwege de omvang of de complexiteit van de datasets. Het is daarom mogelijk dat de metadata van jouw dataset al wel beschikbaar zijn in het DANS Data Station SSH maar dat toegang tot de data nog plaatsvindt via de EASY-omgeving. In dat geval bevatten de metadata van jouw dataset in het DANS Data Station SSH een link naar jouw data in EASY. De komende maanden zal deze situatie worden opgelost. 

Waarom zie ik geen domeinspecifieke metadata of andere domeinaanpassingen in het Data Station Life Sciences en/of het Data Station Physical and Technical Sciences?
Om praktische redenen is het Data Station Life Sciences gelanceerd als een Minimal Viable Product (MVP). In vergelijking met de vorige DANS repository EASY, kun je gebruikmaken van veel nieuwe functies, maar nog niet van expliciete domeinspecifieke diensten. Deze diensten zullen binnenkort (2024) worden ontwikkeld, op basis van de behoeften en eisen van de gebruikers van het Data Station. DANS werkt samen met partnerorganisaties zoals Health-RI en enkele universitaire medische centra (UMC’s) voor standaarden voor gezondheids- en medisch gerelateerde data. Interactie met de ecologische gemeenschap, en deelname aan het LTER-LIFE project, zal de nodige “groene” life science data kennis genereren. Ook het Data Station voor de fysische en technische wetenschappen werd gelanceerd als een MVP. Verdere ontwikkeling van dit datastation zal worden gepland in samenwerking met 4TU.ReseachData, aangezien dit het toonaangevende Nederlandse repository is als het gaat om data gerelateerd aan wetenschap, techniek en design.

Waarom lanceert DANS een data station voor de Physical and Technical Sciences?
Er zijn verschillende redenen voor de oprichting van het DANS Data Station voor de  Physical and Technical Sciences. Allereerst is DANS een nationaal wetenschappelijk instituut dat technische data-archiveringsdiensten levert voor alle wetenschappelijke disciplines. Ook is DANS niet verbonden aan bepaalde universiteiten, wetenschappelijke instituten of hogescholen. DANS wil geen enkele discipline, organisatie of wetenschapper uitsluiten van onze dienstverlening. Als een ingenieur, architect, scheikundige of natuurkundige om wat voor reden dan ook, gebruik wil maken van een DANS Data Station, moet dat altijd mogelijk zijn. Een andere reden voor de oprichting van het data station voor de Physical and Technical Sciences, is dat het oude DANS-repository EASY data bevatte afkomstig uit deze disciplines. DANS is en blijft verantwoordelijk voor de curatie en het duurzaam archiveren van deze datasets. De enige manier om deze verantwoordelijkheid voort te zetten is door een goed data station voor deze data te creëren. 

Waarom heeft DANS niet de nomenclatuur van de TDCC’s gebruikt voor het DANS Data Station Life Sciences (Life Science & Health) en Data Station Physical and Technical Sciences (Natural and Engineering Sciences)?
De naamgeving van wetenschappelijke domeinen, en welke (sub)disciplines er wel of niet toe behoren, is een complex verhaal. ‘Natuurwetenschappen’ omvatten volgens de meeste categoriseringen ook het vakgebied Biologie. Echter, het veel gebruikte ‘Life Sciences’ kan niet los worden gezien van de biologische disciplines. Voor de DANS Data Stations hebben we ervoor gekozen de Natural Sciences onder te verdelen in enerzijds de Life Sciences en anderzijds de Physical Sciences, en deze onderverdeling zie je terug in de namen van deze twee data stations. Het belangrijkste onderscheid is dat de onderzoeksdata van het Data Station Life Sciences levende organismen betreffen, terwijl het Data Station Physical and Technical Sciences zich richt op niet-levende onderwerpen, zoals informatica, technologie en onze fysieke omgeving. De DANS Data Stations volgen in grote lijnen de NARCIS-classificatie, die ook wordt gebruikt voor het aangeven van de (sub)disciplines waartoe datasets behoren. 

De term ‘data stations’ wordt ook gebruikt door het Personal Health Train Network in Nederland, maken de DANS Data Stations deel uit van dit netwerk?
De gelijkenis in naamgeving is een geval van convergente evolutie. In beide situaties hebben ‘data stations’ een identieke functie: het zijn plaatsen waar data wordt verzameld en waar ‘bezoekers’ komen om deze data te bekijken of te gebruiken. Onafhankelijk van elkaar is dezelfde term ‘data stations’ bedacht. Echter, de DANS Data Stations zijn generieker en toegesneden op verschillende wetenschappelijke disciplines.

Ik heb mijn dataset voorzien van geo-metadata (puntgegevens en/of bounding boxes). Waarom is er geen kaartinterface waarmee je datasets ook op locatie kunt zoeken?
Wij realiseren ons dat er behoefte is aan de mogelijkheid om datasets uit een bepaald geografisch gebied te kunnen zoeken. Deze functie is relevant voor alle wetenschappelijke disciplines en het verbinden van gegevens per locatie is vooral van belang om (nieuw) interdisciplinair onderzoek mogelijk te maken. In 2024 wordt eerst het Data Station Archaeology voorzien van een kaartinterface, daarna volgen de overige data stations.

DANS. R.1.6 Versie 1.3, 5 februari 2024