Focus op FAIR: programma 2021-2025
In 2020 vierde DANS zijn vijftienjarig bestaan. We zijn trots op wat we hebben bereikt. Anno 2020 behoort DANS met meer dan 150.000 datasets tot de top-vijf van vergelijkbare repositories in de wereld. We hielpen vorm te geven aan een Europese data-infrastructuur en ontwikkelden een internationaal erkend keurmerk voor repositories. Al doende bloeide DANS op tot een internationaal gerespecteerd expertisecentrum voor FAIR data. We werden goed in het uitvoeren en leiden van Europese projecten. Mede daardoor groeiden we. In 2005 begonnen we met vijftien medewerkers, nu tellen we er zestig.
Onze missie is om hergebruik van onderzoeksdata te bevorderen en daarmee ook de kwaliteit van de wetenschap. Want door FAIR data wordt onderzoek beter controleerbaar en herhaalbaar. En efficiënter: het bouwen van datasets is kostbaar. Bovendien kan koppeling van data leiden tot nieuwe ontdekkingen en inzichten. Door hergebruik en verbinding versnelt de kenniscirculatie en neemt ons vermogen complexe vragen op te lossen toe. Kortom, beter gebruik van data leidt tot betere wetenschap en dat doet ertoe voor de samenleving.
Het werk van DANS is dus maatschappelijk zinvol. En er is nog veel te doen. De meeste datasets van gepubliceerd Nederlands onderzoek verblijven nog op lokale servers en schijven, beperkt houdbaar en ontoegankelijk voor de buitenwereld. FAIRness van onderzoeksdata heeft een stevige impuls nodig. Financieel, maar ook in termen van samenwerking en afstemming. Daarvoor is in Nederland het Nationaal Programma Open Science ingericht. Als een van de grote spelers in het Nederlandse datalandschap kan DANS daaraan krachtig bijdragen.
Bij het ontwerpen van ons vierde vijfjarenprogramma hebben we ons niet laten leiden door de vraag hoe DANS alleenstaand zijn succes kan prolongeren. In plaats daarvan gingen we uit van de vraag wat het Nederlandse datalandschap nodig heeft om succesvol te zijn en hoe DANS daaraan de meest effectieve bijdrage kan leveren. Ons antwoord luidt: op drie manieren. Als veelzijdig data-repository, als expertisecentrum voor FAIR data en in samenwerking met anderen. Dat levert een vernieuwend programma op dat we hieronder kort uiteenzetten. De hoeders van DANS, KNAW en NWO, hebben zich erachter gesteld.
Drie programmalijnen
Expertisecentrum voor FAIR onderzoeksdata
DANS zal zijn pakket aan expert-services uitbreiden en vernieuwen. Aan FAIR data-expertise is duidelijk een groeiende behoefte en DANS kan daaraan een substantiële bijdrage leveren.
DANS werkte in tientallen internationale projecten om standaarden, technieken, methoden en werkwijzen te ontwikkelen voor het beter delen, hergebruiken en archiveren van onderzoeksdata. En intussen leerden we als data-repository ook hoe weerbarstig de praktijk kan zijn. Het is geen loze claim als we stellen dat DANS door deze combinatie van theorie en praktijk is uitgegroeid tot een regelrecht expertisecentrum. In de komende periode maken we deze functie expliciet. Vraag naar expertise over FAIR data en Research Data Management krijgt zo een helder richtpunt. Een team van ongeveer twintig Research Data Management Consultants en R&D-engineers zal zich bezighouden met de volgende activiteiten.
- Het leveren van expertise als deelnemer aan onderzoeks- en data-infrastructuurprojecten, vooral op Europees niveau. Naar verwachting zal deze vraag toenemen. Een nieuwe uitdaging zien we in het overbrengen van nieuwe kennis uit internationale projecten naar nationale niveau.
- Het nemen van bestuurlijke verantwoordelijkheid in internationale organisaties, zoals we nu al doen in bijvoorbeeld de Research Data Alliance, CoreTrustSeal, het World Data System, DataCite en DARIAH.
- Het leveren van consultancy op aanvraag en als lid van nationale en internationale adviesorganen.
- Het trainen van dataprofessionals en onderzoekers. Kennis over omgang met data is nog geen vast onderdeel van universitaire curricula en in het algemeen gesproken kan worden vastgesteld dat er in het onderzoek sprake is van een gebrek aan data-literacy. Ook onder data stewards is groeiende behoefte aan advies, opleiding en bijspijkercursussen.
- Om de eigen strategievorming een betere basis te geven, zal DANS een nieuw team opzetten om business intelligence te verwerven. Het BI-team is gericht op het verzamelen en analyseren van informatie over gebruikers, concurrentie, de markt en trends in omgang met data binnen het wetenschappelijk onderzoek. Veel van deze gegevens en analyses zullen we open delen. Zo’n monitor lijkt ons van groot nut, want de gegevens ontbreken nu goeddeels, terwijl ze hoogst relevant zijn voor het vormen van nationaal en Europees beleid – en het beoordelen van de effecten ervan.
Veelzijdig data-repository
DANS gaat zijn pakket aan datadiensten ingrijpend vernieuwen. Uitgangspunt daarbij is dat de behoeften per wetenschappelijke discipline aanzienlijk verschillen. Ook de aard en afmetingen van de datasets zelf lopen nogal uiteen. Die verschillen komen tot uiting in de diversiteit en rijkdom van het nationale landschap. Er zijn uitstekende datadiensten die dicht op het onderzoek zitten, maar niet alles is afgedekt. Dat is de rol van meer generieke repositories als DANS.
Het nadeel van generieke catch-all repositories is hun one-solution-fits-all-benadering. Onderzoekers kunnen eigenlijk weinig meer dan datasets deponeren of downloaden. Waar behoefte aan is, zijn datadiensten die naadloos integreren met virtual research environments (VRE’s) en mogelijkheden bieden voor bewerking, versieopslag en analyses met externe tools. En natuurlijk moet er de optie zijn om de dataset voor de lange termijn veilig te stellen en bruikbaar te houden. Maar aangezien VRE’s en praktijken van onderzoekers in diverse disciplines nogal uiteenlopen, zullen voor verschillende onderzoeksdisciplines verschillende oplossingen moeten worden gevonden.
Dat is tot nu nog geen generiek repository gelukt, maar DANS gaat deze uitdaging aan. Met een nieuwe, modulaire opzet van onze diensten bedienen we verschillende gebruikersgroepen op maat, terwijl onze infrastructuur meegroeit met nieuwe ontwikkelingen en tegelijkertijd stabiliteit en betrouwbaarheid biedt.
DANS gaat een combinatie van reuse en long-term preservation services bieden. De technische ondergrond van de DANS-infrastructuur zal worden gevormd door Dataverse, een platform ontwikkeld door een internationale gemeenschap onder aanvoering van Harvard University.
Verschillende installaties van Dataverse – die we Data Stations zullen noemen – stemmen we af op de wensen van diverse disciplines en onderzoeksgemeenschappen. De Data Stations zijn bestemd voor datasets waaraan en waarmee nog gewerkt wordt. Onderzoekers kunnen met hun data terecht in een van de DANS Data Stations: Archaeology, Social Sciences and Humanities, Life Sciences, en Physical and Technical Sciences. Elk station krijgt een Data Station Manager, die de contacten met de betreffende onderzoeksgemeenschap legt en onderhoudt.
Naast de Data Stations blijft DANS DataverseNL aanbieden, een platformdienst waarin universiteiten, hogescholen en onderzoeksinstellingen hun eigen instellingsrepository kunnen vestigen.
Data in de Data Stations en DataverseNL vinden automatisch hun weg naar de DANS Data Vault, een beveiligd, betrouwbaar en gecertificeerd long-term preservation repository. Hierin staan ook alle datasets die al eerder aan DANS waren toevertrouwd. De Vault wordt ook als dienst aangeboden aan instellingen en bedrijven die hun data-archief voor de lange termijn bij een betrouwbare instantie willen opslaan. DANS doet dat op een uniforme manier die is gebaseerd op internationale standaarden en best practices.
Om deze nieuwe opzet waar te kunnen maken, zal DANS zijn organisatie ingrijpend aanpassen. Er komt een team van Data Station Managers en een R&D-team. Alle technische onderdelen van DANS komen onder leiding te staan van een Chief Technology Officer, die vanuit de directie constante innovatie zal aanjagen.
Actieve samenwerker
DANS gaat meer investeren in samenwerking en afstemming. De opgave om het percentage FAIR onderzoeksdata in Nederland op een aanvaardbaar peil te brengen en analyse ervan te vergemakkelijken, vereist een gezamenlijke aanpak. Bewustwordingscampagnes, samenhangende trainingsprogramma’s, verbinding van datasets uit verschillende onderzoeksdisciplines mogelijk maken: het zijn zaken die geen enkele organisatie uit het Nederlandse datalandschap eigenhandig kan regelen.
DANS wil graag dat zijn diensten complementair zijn aan – en als het zinvol is verbonden zijn met – de services die andere dienstverleners bieden. Mede in het kader van het Nationaal Programma Open Science zal DANS zich de komende periode inzetten om samenwerking en afstemming te bevorderen. We zijn daarbij voorstander van een pragmatische aanpak waarbij bestaande organisaties in afstemming met het NPOS-bestuur verantwoordelijkheid nemen. Dat zouden in eerste instantie de grotere discipline-generieke organisaties moeten zijn met voldoende resources en slagkracht. DANS is zo’n organisatie, net als het eScience Center en SURF. Deze drie organisaties zijn min of meer complementair voor wat betreft hun belangrijkste aandachtsgebieden: data, software en infrastructuur. Maar tussen deze domeinen is ook verbinding nodig. Als de drie nationale organisaties hun eigen activiteiten coördineren en vervolgens afstemming binnen het landschap gaan faciliteren, is er al veel tot stand gebracht.
Tegelijkertijd denkt DANS dat concrete bottom-up initiatieven op kleinere schaal ook effectief kunnen zijn. We zullen graag samenwerken in projecten die tot verbetering van diensten en meer afstemming leiden en daartoe ook initiatieven ondernemen. Het samenwerkingsverband met 4TU.ResearchData en SURF in Research Data Netherlands (RDNL) zetten we graag voort.
Bekijk ook de video waarin directeur Henk Wals het programma toelicht:
Meer informatie
Dit document is ook beschikbaar als .pdf. In dit interview staat een nadere toelichting op dit document.