DANS lanceert Data Stations per wetenschappelijk domein

2 juni 2021

DANS lanceert dit jaar domeinspecifieke Data Stations: een plek waar onderzoekers uit verschillende wetenschappelijke disciplines zelf hun data online kunnen opslaan, delen en publiceren, tijdens de onderzoeksperiode en daarna.

Per wetenschappelijk domein verschilt de aard en omvang van datasets. Ook de behoeften hoe met bestaande data te werken, kan per discipline verschillen. Zo zal een onderzoeker uit de sociale wetenschappen geïnteresseerd zijn in data over het gedrag van mensen, terwijl een onderzoeker uit de levenswetenschappen meer wil weten over het soort organisme of ziektebeeld binnen datasets. Dit brengt met zich mee dat elke discipline zijn eigen metadata gebruikt om het onderzoek te beschrijven met bijbehorende discipline specifieke termen en thesauri.

Met het lanceren van domeinspecifieke Data Stations zorgt DANS ervoor dat gebruikers niet alleen data kunnen deponeren en downloaden, maar ook een stap verder kunnen gaan, als ze dat willen. Henk Wals, directeur DANS: “In een Data Station kunnen onderzoekers en onderzoeksteams hun eigen dataverzameling aanleggen, beheren en delen in een omgeving die is toegespitst op hun eigen vakgebied en verbonden is met hun eigen onderzoeksinfrastructuren. Zo ontstaat een groeiende domeinspecifieke collectie, waarin op grond van specifieke metadata en termen gezocht en gevonden kan worden, een portal voor een bepaald vakgebied. Dit vormt dan weer een onderdeel van een grotere research infrastructuur, zoals bijvoorbeeld ODISSEI voor de sociale wetenschappen.”

DANS zet per Data Station een Data Station Manager in, aanspreekpunt voor de betreffende onderzoeksgemeenschap. De Data Stations zijn gebouwd op basis van Harvard University’s open source Dataverse-technologie. Dit heeft als grote voordeel dat de Data Stations meeliften op de ontwikkelingen ingezet door een grote en groeiende internationale community. Terwijl DANS met de Data Stations aansluit bij de specifieke behoeften van verschillende wetenschappelijke communities, is het oog tevens gericht op een andere ontwikkeling: de trend naar meer thematisch, cross-disciplinair onderzoek. DANS zorgt er dan ook voor dat de datasets in de verschillende stations volledig interoperabel zijn.

Veilig, betrouwbaar en gecertificeerd

Kunnen data in de Data Stations ook voor de lange termijn veilig worden opgeslagen? Wals: “Ja, dat klopt, long-term preservation is een basisfunctie van DANS. Zo zorgen we ervoor dat onderzoek controleerbaar, herhaalbaar en herbruikbaar wordt. Data in de Data Stations worden doorgestuurd naar de DANS Data Vault, een beveiligd, betrouwbaar en gecertificeerd repository voor de lange termijn opslag van data. Hierin staan ook alle datasets die al eerder aan DANS waren toevertrouwd. De Vault wordt ook als dienst aangeboden aan organisaties die hun data-archief voor de lange termijn bij een betrouwbare instantie willen opslaan.”

Diensten op een rij

De Data Stations worden zorgvuldig neergezet, de eerste lancering betreft het Data Station Archaeology. Daarna worden ook andere Data Stations gelanceerd. Met de Data Stations bedient DANS in principe alle disciplines, maar DANS zal zich vooral richten op de sociale wetenschappen, de geesteswetenschappen en de levenswetenschappen. Dat zijn de domeinen waarvoor geen specifieke repositories bestaan en van waaruit al tienduizenden datasets bij DANS zijn gedeponeerd. Voor Data uit Physical and Technical Sciences blijft 4TU.ResearchData wat DANS betreft het eerst aangewezen Nederlandse repository. Dit betreffende Data Station van DANS biedt toegang tot de bescheiden collectie die DANS op dit gebied al beheert. 

Bij DANS gearchiveerde datasets in EASY, het online repository, worden successievelijk opgenomen in de verschillende Data Stations. Zo zijn ook deze data weer veilig ondergebracht, meer toegespitst op het domein van onderzoek. Naast de Data Stations blijft DANS DataverseNL aanbieden, een platformdienst waarin universiteiten, hogescholen en onderzoeksinstellingen hun eigen instellingsrepository kunnen vestigen. De aldaar gedeponeerde datasets zijn tevens vindbaar via de domeingerichte Data Stations. 

Blik op toekomst

Wals sluit af met een blik op de toekomst: “De Data Stations en de Vault gaan onderdeel vormen van een basisinfrastructuur voor research data, die DANS samen met SURF ontwikkelt. DANS en SURF willen dat hun diensten samen een compleet pakket gaan vormen dat gebruikers een naadloze ervaring biedt. Lokale en thematische Digital Competence Centers kunnen dan van dit dienstenpakket gebruik maken om onderzoekers te helpen met hun data te werken en deze FAIR te deponeren. Zo zou uiteindelijk een heldere en efficiënte nationale infrastructuur voor research data kunnen ontstaan.”

Meer informatie

Neem voor meer informatie contact met ons op. 

Heb je vragen over dit bericht?

Je naam(Vereist)
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.