Voordelen en nieuwe eigenschappen van de DANS Data Stations ten opzichte van EASY

 

Betrouwbare domeinspecifieke data-repository

Datasets kunnen sneller na het indienen beschikbaar worden gesteld doordat de curatie van je datasets, door de datamanagers van DANS, door de architectuur van de DANS Data Stations beter wordt ondersteund dan door die van EASY.

De DANS Data Stations maken gebruik van Dataverse – een Open Source repository software ontwikkeld door Harvard’s Institute for Quantitative Social Science (IQSS). De software wordt verder ontwikkeld door een grote internationale gemeenschap waar DANS actief aan bijdraagt. 

Uiteraard blijven we de nieuwste certificeringseisen volgen die aan betrouwbare archieven worden gesteld, zodat de DANS Data Stations ook het internationale CoreTrustSeal-predicaat krijgen.

De DANS Data Stations zijn specifiek gericht op jouw domein. Als je vragen hebt over het deponeren, vinden of hergebruiken van data, kun je terecht bij een van de Data Station Managers. Zij hebben vakinhoudelijke expertise die aansluit bij de discipline waarin je bent geïnteresseerd.

 

Deponeren van data

Je kunt op het DANS Data Station inloggen met je instituuts- (SURFconext), Google- of GitHub-account. Als je eerder een dataset hebt gedeponeerd in EASY, is het ook mogelijk om in het data station in te blijven loggen met je EASY-account. 

Je kunt per bestand beslissen of je de toegang wilt beperken of een embargo wilt opleggen.

Alle licenties van Creative Commons worden ondersteund. Daarnaast zijn er licenties voor software. 

Je kunt je dataset aanpassen en een nieuwe versie maken. Aanpassingen van de metadata worden gezien als minor version (1.0 wordt 1.1) terwijl aanpassingen van de data worden gezien als een major version (1.0 wordt 2.0). Alle versies worden bewaard en zijn in te zien, en je kunt overzicht houden op de verschillen tussen de versies.

Collecties worden ondersteund. Wat in EASY een thematische pagina heette, is in het DANS Data Station een collectie geworden. Er is een lijst met collecties aanwezig en bij het deponeren van de dataset kun je een collectie selecteren. Vervolgens zijn de collecties ook te vinden via een filter zodat je een collectie gemakkelijk kunt selecteren, bijvoorbeeld na een zoekvraag of in combinatie met andere filters. 

Je kunt externe controlled vocabularies koppelen aan de data. Zo kun je voor de sociale wetenschappen bijvoorbeeld je datasets omschrijven met termen van de European Language Social Science Thesaurus (ELSST). Voor archeologie zijn vijf lijsten met termen beschikbaar uit het Archeologisch Basis Register (ABR+). Je kunt termen uit deze vocabulaires ook gebruiken bij het doorzoeken van de datasets. In de toekomst zullen we nog meer vocabulaires, specifiek gericht op de geesteswetenschappen, toevoegen. 

Vinden van data 

De DANS Data Stations hebben meer filters beschikbaar waarop je kunt zoeken of inperken. Denk aan: Year, Keyword Term, Language of Metadata.

Naast ‘gewoon’ zoeken, bieden de DANS Data Stations ‘Advanced Search’ op bijna ieder veld en kun je ook zoeken op file metadata. 

De DANS Data Stations bieden full-text indexering. Dus niet alleen de metadata, maar ook de meeste bestanden zelf (zoals PDF, xml etc.), worden geïndexeerd en zijn doorzoekbaar. 

Een ontoegankelijk gemaakte of verwijderde dataset wordt gemarkeerd met een zogenaamde ‘tombstone’. Dit is een pagina waarop staat aangegeven waarom de data niet meer beschikbaar zijn. Indien van toepassing verwijst deze naar een vervangende dataset.

 

Hergebruik van data

Binnen het DANS Data Station kun je PDF’s en afbeeldingen direct bekijken en mediabestanden afspelen.

Je kunt de bestanden van een dataset eenvoudig doorzoeken en filteren waardoor het gemakkelijk is om selecties van bestanden te maken.

Je kunt data in verschillende formats downloaden. Tabulaire data (zoals bijvoorbeeld SPSS) worden automatisch omgezet naar open bestanden (.tab) waardoor deze makkelijker kunnen worden ingelezen in verschillende programma’s. 

Dataset metrics zijn beschikbaar voor elke dataset: een teller geeft het aantal downloads van de bestanden in een dataset weer. Zo kun je zien hoe vaak een dataset is gedownload. 

 

Citeren van data

Citatie-informatie is niet alleen beschikbaar voor datasets maar ook voor individuele bestanden. Zo kun je makkelijk bestanden uit een dataset citeren.

Metadata voor het citeren van datasets kun je direct exporteren naar BibNote, RIS en BibTex. Je kunt metadata in veel formaten exporteren waaronder Dublin Core, DDI, DataCite, JSON en Schema.org.

 

 

© DANS. R.4.5 Versie 1.0, 11 april 2023