Vertrouwen en transparantie in de wetenschap: Een voortdurende reis
Vorige maand had ik het genoegen om de openingskeynote te geven tijdens de 18e editie van de International Digital Curation Conference (IDCC24) in Edinburgh. Een van de vele zorgen van deze tijd is het vermogen om informatie om ons heen te vertrouwen. Transparantie is één manier om vertrouwen te bevorderen en in die zin vond ik het thema van de conferentie ‘Vertrouwen door Transparantie’ zowel actueel als relevant.
De context waarin ik de afgelopen jaren over vertrouwen heb nagedacht en gesproken, is natuurlijk gerelateerd aan mijn dagelijkse werk bij DANS, een nationaal repository en kenniscentrum.
Het hergebruiken van data die door anderen is verzameld, vereist veel vertrouwen. En we weten allemaal dat er een probleem is met vertrouwen in samenlevingen over de hele wereld. Sociale media met hun algoritmes, fakenews en de snelle ontwikkeling van Artificial Intelligence (AI) spelen een grote rol in dit afnemende vertrouwen. Mensen weten gewoon niet meer wat of wie ze nog kunnen vertrouwen. Het publieke vertrouwen in de wetenschap is gebaseerd op onze hoop en verwachting dat de wetenschap ons leven gezonder, langer, interessanter en dus aangenamer zal maken.
Wat we ook weten, is dat het publieke vertrouwen in de wetenschap een belangrijke graadmeter is voor het beoordelen van de impact van wetenschap. En dat is een cruciaal aspect: vertrouwen in de wetenschap is fundamenteel voor de wetenschap om haar rol in onze samenleving ten volle te kunnen spelen. We moeten er alles aan doen om ervoor te zorgen dat wetenschappelijke resultaten hun weg vinden naar de maatschappij om ons te helpen bij het aanpakken van de immense maatschappelijke uitdagingen waarmee we heden ten dage worden geconfronteerd.
Dit betekent dat er een grote verantwoordelijkheid ligt, ook voor de wetenschapssector zelf, om er alles aan te doen om deze zo betrouwbaar mogelijk te maken: dit betreft zowel individuen als organisaties. En het gaat om alle stadia van het wetenschappelijke proces: het verzamelen, verwerken en analyseren van data, en het schrijven en publiceren van papers.
Echter, net als elk ander deel van de samenleving heeft de wetenschapssector problemen met betrouwbaarheid. De massale datafraudezaak in 2011 door Diederik Stapel, een Nederlandse sociaal psycholoog die zijn data in ten minste 50 gevallen heeft verzonnen, is slechts één voorbeeld. Gevallen als deze worden gerapporteerd vanuit alle delen van de wereld en zijn waarschijnlijk altijd al aanwezig geweest. En met de komst van AI wordt het vaststellen van de waarheid en het creëren van betrouwbaarheid zelfs nog complexer en uitdagender. Als onderzoekers hun data delen, kunnen ze worden gecontroleerd en hergebruikt en zou Stapel misschien niet zo lang zijn weggekomen met zijn fraude. Het delen van data kan de basis vormen voor onderzoeksverificatie en reproduceerbaarheid, en het kan ook een pad openen naar bredere samenwerking.
Openheid van data alleen is echter niet genoeg om vertrouwen in de data te creëren, de focus op FAIR is een belangrijke stap in de goede richting. Het zegt iets over de zorg die is besteed aan het beschikbaar maken van data. En deze zorg die aan een dataset wordt besteed, bepaalt op haar beurt deels de herbruikbaarheid ervan. Om vertrouwd te worden door een hergebruiker, moeten de data niet alleen openlijk beschikbaar zijn maar ook betrouwbaar zijn, en in zekere zin is de waargenomen kwaliteit van de data een indicatie voor hun betrouwbaarheid. Hier spelen de kernelementen van vertrouwen een rol: transparantie, competentie, integriteit, consistentie.
De FAIR-principes en de vele implementaties ervan helpen ons om de zorg die we aan een dataset geven te verbeteren. Dit definieert wat je misschien de ’technische’ kwaliteit van een dataset zou kunnen noemen. Maar dit is nog steeds niet genoeg. Ik heb eerder opgemerkt dat een volledig open dataset nutteloos kan zijn voor anderen, als het niet FAIR genoeg is en dus niet herbruikbaar. Een volledig FAIR dataset geeft geen garanties over de kwaliteit van het onderzoek dat tot deze data heeft geleid. FAIR geeft geen inzicht in de betrouwbaarheid van de data.
Als we vertrouwen in data willen creëren, hebben we FAIR nodig voor de ’technische’ datakwaliteit, om ervoor te zorgen dat de data vindbaar, toegankelijk, interoperabel zijn. Maar voor de ‘herbruikbaarheid’, de R, is meer nodig. FAIR moet hand in hand gaan met wetenschappelijke integriteit, om de betrouwbaarheid van de data te verzekeren. De integriteit van het onderzoek waarvan de data het resultaat zijn, is een belangrijke dimensie van de kwaliteit en daarmee van de betrouwbaarheid van een dataset. Het opbouwen van vertrouwen zal belangrijker worden met de groei van gecoördineerde onderzoeksinfrastructuren, het groeiende belang van multidisciplinair onderzoek om onze problemen op te lossen, en last but not least de komst van AI.
We zijn pas halverwege deze reis naar vertrouwen in de wetenschap en FAIR en open data. Momenteel wordt er veel inspanning geleverd om FAIR uit te breiden naar andere onderzoeksresultaten zoals software en semantische artefacten. We ontwikkelen meetmethoden en tools om de mate van FAIR te beoordelen, wat op zichzelf al veel uitdagingen met zich meebrengt. We zijn bezig met het definiëren en implementeren van de manier waarop betrouwbare onderzoeksinfrastructuren en -diensten eruitzien, die FAIR mogelijk moeten maken, en hoe we deze kunnen beoordelen. We geven vorm aan citizen science en zetten onze eerste stappen naar nieuwe, transparante en inclusieve manieren om onderzoekers te beoordelen en te belonen.
Bij DANS proberen we bij te dragen aan een betrouwbare data-infrastructuur met onze Data Stations. En met onze deelname aan en coördinatie van Europese projecten, zoals FAIR-IMPACT, onze betrokkenheid bij internationale organisaties zoals CoreTrustSeal en de Research Data Alliance, werken we samen met vele partners over de hele wereld aan Open Science, FAIR data en een betrouwbare en transparante Europees landschap van onderzoeksdata.
Ingrid Dillo
Wil je de IDCC24 keynote van Ingrid Dillo terugkijken? Klik dan hier.
FAIR & Open data