Hoe deponeer je persoonlijke gegevens?

30 januari 2024

De Europese Dag van de Gegevensbescherming is de verjaardag van Verdrag 108 van de Raad van Europa over de bescherming van persoonsgegevens. Het is de eerste wettelijk bindende internationale gegevensbeschermingswet en wordt elk jaar op 28 januari gevierd door de 47 landen van de Raad van Europa en de EU-instellingen. Als onderzoeker ben je verantwoordelijk voor de bescherming van de privacy van gegevens die je tijdens je wetenschappelijk onderzoek verzamelt. Wij willen je graag op weg helpen met hoe je dit het beste kunt doen. Dit artikel geeft je een snel overzicht.

Datasets die persoonlijke gegevens bevatten kunnen worden gedeponeerd in een repository, bijvoorbeeld in één van de DANS Data Stations. Als je dataset persoonlijke gegevens bevat, zijn er echter extra dingen waar je rekening mee moet houden. Je hebt bijvoorbeeld ‘geïnformeerde toestemming’ nodig van de deelnemers aan het onderzoek. Je kunt er ook voor kiezen om uw dataset onder ‘beperkte toegang’ te publiceren. Dit betekent dat je gebruikers toestemming moet geven voordat ze de gegevens mogen gebruiken.

Wat zijn persoonsgegevens?

Persoonsgegevens in de zin van de General Data Protection Regulation (GDPR) zijn gegevens waarmee een levende persoon direct of indirect kan worden geïdentificeerd. Voorbeelden zijn namen, identificatienummers, locatiegegevens, online identificatoren of elementen die de fysieke, fysiologische, genetische, mentale, economische, culturele of sociale identiteit van een persoon karakteriseren. Anonieme gegevens, waarbij de identificerende informatie is verwijderd en er geen sleutel bestaat om deze terug te zetten, worden niet beschouwd als persoonsgegevens. Onderzoeksgegevens worden echter meestal gepseudonimiseerd, waarbij identificerende informatie wordt verwijderd maar er nog steeds een koppelingssleutel bestaat tussen de gegevens en identificeerbare informatie. Gepseudonimiseerde gegevens worden beschouwd als persoonsgegevens en vallen onder de GDPR.

Gegevens beschermen

Er zijn veel tools en richtlijnen beschikbaar om je te helpen je gegevens te beschermen of de-identificeren. Een manier om gegevens te de-identificeren is hercodering: bijvoorbeeld geboortedatum naar geboortejaar, postcode naar alleen cijfers, beroep naar standaardclassificatie. De juiste methode voor de-identificatie zal altijd afhankelijk zijn van de context, omdat de balans tussen anonimiteit en verlies van informatie moet worden beoordeeld.

We hebben een aantal hulpmiddelen op een rijtje gezet die je kunnen helpen bij het beschermen van persoonsgegevens:

SURF Wikiwijs e-learning module ‘Privacy in onderzoek’
CESSDA Data Management Expert Guide – hoofdstuk ‘Beschermen’ (Beschikbaar in Engels)
Nederlandse Universiteiten (UNL) : Richtlijn voor het gebruik van persoonsgegevens in wetenschappelijk onderzoek (Aan deze richtlijn wordt momenteel de laatste hand gelegd).
Europese Raad voor gegevensbescherming (EDPB): GDPR: Guidelines, Recommendations, Best Practices

Hoe maak je kwalitatieve gegevens herbruikbaar?

Kwalitatieve gegevens – zoals interview- of casestudiedata – zijn vaak moeilijk te delen, omdat het rijke en complexe gegevens zijn die moeilijk te de-identificeren zijn zonder cruciale informatie te verliezen. Daarom hebben we een praktische handleiding gemaakt ‘Making Qualitative Data Reusable’. Deze handleiding geeft een overzicht van de uitdagingen die in het bijzonder gepaard gaan met het herbruikbaar maken van kwalitatieve data, en geeft richtlijnen over hoe herbruikbaarheid kan worden verbeterd en aangepakt in alle stadia van de levenscyclus van onderzoeksdata. De handleiding bevat ook een beslisboom die onderzoekers en data stewards kunnen gebruiken om de opties voor het herbruikbaar maken van kwalitatieve data te evalueren die het meest relevant zijn voor hun projecten. De handleiding en de beslisboom zijn beide (in Engels) beschikbaar op Zenodo.

Deponeren in een DANS Datastation

DANS Data Stations zijn domeinspecifieke repositories die een veilige digitale omgeving bieden waarin individuele onderzoekers of groepen onderzoekers de mogelijkheid hebben om datasets op te slaan, met uitgebreide metadata, versiebeheer en tools om informatie automatisch aan te vullen. Daarnaast is het mogelijk om datasets in deze data stations te koppelen aan dataportalen, platforms en specifieke websites, waardoor datasets nog beter vindbaar en herbruikbaar worden voor zowel wetenschappelijke als niet-wetenschappelijke gebruikers. De onderzoeksgegevens kunnen digitaal worden gearchiveerd en gedeeld onder alle Creative Commons open licenties, maar het is ook mogelijk om gevoelige (persoons)gegevens te beschermen en per dataset te bepalen of andere gebruikers toegang hebben tot de gegevens. Als een dataset pas na een bepaalde periode beschikbaar mag worden gesteld, kan deze worden opgeslagen met een embargo.

Meer informatie

Wil je meer informatie over een van de Datastations of hulp nodig hebt bij het deponeren van datasets, neem dan contact op met de Data Station Managers, bezoek ons wekelijkse online Open Hour op maandagochtend of stuur een e-mail via ons contactformulier.