Nieuwe versie ODISSEI Portal bevat metadata in Croissant-formaat
ODISSEI presenteert een nieuwe versie van de ODISSEI Portal. In de Portal kun je metadata vinden van meer dan 8.500 sociaal wetenschappelijke datasets van verschillende Nederlandse instellingen zoals CBS, Centerdata (LISS), DANS, IISH, en de instellingen die samenwerken in DataverseNL.
De Portal is gebouwd op Dataverse software, die nu is geüpgraded naar versie 6.2. Deze versie bevat mooie nieuwe onderdelen die het makkelijker maken om de juiste dataset te vinden en die de herbruikbaarheid van de (meta)data vergroten.
Snel open datasets vinden
Naast de mogelijkheid om te filteren op publicatiejaar of onderwerp, kunnen gebruikers nu openbare datasets met een creative commons licentie selecteren. Datasets die een toegangsbeperking hebben, hebben in de terms velden van de metadata een connectie met het prototype van de Data Access Broker (DAB) die de gebruiker naar meer informatie leidt over de toegangsprocessen bij de specifieke instellingen die de data beheren. In toekomstige versies wordt de DAB uitgebreid om automatisch de licentiecondities te verwerken
Metadata export in Croissant-formaat
De Portal maakt het nu ook mogelijk om metadata in het nieuwe Croissant-formaat te downloaden, waardoor metadata beter geschikt wordt voor machine learning. Croissant is gemeenschappelijk ontwikkeld door wetenschappers en bedrijven met een actieve bijdrage van DANS en Harvard. Het bouwt voort op schema.org. Croissant wordt al door verschillende tools en repositories ondersteund en sinds versie 2.6 is het ook onderdeel van de hoofdcode van de Dataverse software. Dit verbetert de FAIRness van de metadata die in de Portal beschikbaar is en ondersteunt uitwisseling met andere tools en repositories zoals (commerciële) platforms als Kaggle en HuggingFace.
Metadata verrijkt
Een belangrijk onderdeel van de ODISSEI portal is onze pipeline om metadata te verrijken. Metadata wordt van de instellingen verzameld, geharmoniseerd en verrijkt door gestandaardiseerde trefwoorden toe te voegen. In het bijzonder voegen wij termen toe uit de European Social Sciences Language Thesaurus (ELSST), een belangrijke vocabulaire die door veel sociaal wetenschappelijke archieven wordt gebruikt en wordt beheerd door CESSDA. De verrijkingen in de Portal maken het voor gebruikers mogelijk om gerelateerde datasets van verschillende instellingen te vinden op basis van de gestandaardiseerde ELSST termen.
Presentaties van de Portal
Een webinar is gepland om onderzoekers wegwijs te maken in de Portal. De Portal zal ook gepresenteerd worden op de ODISSEI-conferentie. De Portal wordt verder ontwikkeld en verbeterd tot het einde van 2024 als onderdeel van het ODISSEI Roadmap project. Vanaf 2025 wordt de Portal geïntegreerd in het werk, gericht op zoeken en vinden van data in de FAIR workstream van het SSHOC-NL project – een samenwerking tussen ODISSEI en CLARIAH.
De ODISSEI Portal is gratis beschikbaar. Voor aanvullende informatie of vragen over de Portal of om feedback te geven, neem contact op met:
Social Sciences & Humanities
RDMTraining & OutreachTools