Nu de CESSDA Data Catalogue (CDC) operationeel is, wordt van dienstverleners verwacht dat zij toegang tot hun collecties verlenen aan de catalogus bot. De bot verzamelt metadata uit verschillende bronnen, zodat ze allemaal beschikbaar worden in één loket, de CDC. Onderzoekers kunnen zo in heel Europa datasets vinden die beschikbaar zijn voor hergebruik. Om dit mogelijk te maken, moeten dienstverleners hun metadata echter zo formatteren dat ze voldoen aan de voorwaarden die in de CESSDA DDI profielen zijn vastgesteld. Dit is niet altijd gemakkelijk, vooral wanneer dienstverleners een beroep doen op extern ontwikkelde tools om hun collecties te beheren.
Een van die tools is Dataverse, een webapplicatie voor gegevensinvoer en -verspreiding die is ontwikkeld door het Institute for Quantitative Social Science (IQSS) van de Harvard University. Dataverse wordt gebruikt door acht van de dienstverleners en partners van CESSDA. Hoewel de software een zekere mate van aanpassing van de metadata mogelijk maakt, moet de XML-output worden gebruikt zoals hij is. Dat is niet langer het geval dankzij het door SODHA ontwikkelde SUPER DADA-script. Eenmaal uitgevoerd, bewerkt het script de door Dataverse geproduceerde metadata om ze in overeenstemming te brengen met de CESSDA CDC DDI 2.5 Profile 1.0.4. Dit betekent dat de CDC geen constraint violations zal teruggeven en dat alle informatie in de metadata correct zal worden verspreid in de eigen metadata velden van de CDC.
Het script is beschikbaar op GitHub in een specifieke sub-repository aangemaakt door IQSS voor CESSDA-gerelateerde Dataverse ontwikkelingen. De Belgische CESSDA-dienstverlener, SODHA (Social Sciences and Digital Humanities Archive) verwelkomt feedback en suggesties voor verbetering.
Meer informatie
Lees meer over het script op de website van CESSDA. Neem voor meer informatie contact op met Ricarda Braukmann.