FAIR data van de volkstelling 1947

24 november 2021

Het Data Processing team van DANS beheert een omvangrijke collectie van datasets in EASY met gegevens per gemeente van de Nederlandse Volkstelling 1947. Onlangs verscheen daarover het artikel ‘Detailed Tables from the Dutch Census 1947: Experiences and Lessons Learned in Publishing a Large Dataset’ in het Research Data Journal for the Humanities and Social Sciences.

Gedigitaliseerde volkstellingen

Volkstellingen hebben een lange geschiedenis. In Nederland zijn volkstellingen gehouden vanaf 1795, veelal elke 10 jaar. Tot en met 1971 waren het in hoofdzaak traditionele tellingen, waarbij tellers van huis tot huis vragenlijsten invulden met de bewoners. Resultaten werden gepubliceerd in gedrukte vorm, in totaal zo’n 42.000 pagina’s over de periode 1795 – 1971. Vanaf 1997 zijn die publicaties in diverse projecten gedigitaliseerd. Sinds 2004 zijn alle tabellen in een digitaal verwerkbare vorm beschikbaar bij DANS.

Gedetailleerde gegevens van Volkstelling 1947

Naast de publicaties zijn van een aantal tellingen gedetailleerde gegevens bewaard bij het Centraal Bureau voor de Statistiek (CBS). Van de Volkstelling 1947 zijn dat ca. 30.000 bladen op A4 formaat met gegevens per gemeente en deels ook voor wijken en buurten binnen gemeenten. Het gaat over veel onderwerpen: van leeftijd en nationaliteit tot kerkgenootschap, van beroep tot forensisme en vele andere.

Methodiek om de massa gegevens herbruikbaar te maken

Eerder waren gescande images van de 30.000 bladen gemaakt. Met data-entry zijn die alle overgenomen in Excel werkbladen. De uitdaging was om die massa gegevens op zo’n manier te publiceren dat zij gebruikt kunnen worden in nieuw historisch onderzoek. In het artikel wordt uitvoerig beschreven op welke manier dat is gerealiseerd. Richtlijn was daarbij om de totale dataset FAIR te maken, met speciale aandacht voor de R van Reusable.

Voorbeeld van nieuwe analyse

De herbruikbaarheid van de gedetailleerde dataset voor Volkstelling 1947 wordt geïllustreerd met een voorbeeld. Het betreft het aantal personen zonder Nederlandse nationaliteit per 10.000 van de bevolking, per gemeente in 1947. Het artikel sluit af met een aantal mogelijkheden voor verder gebruik van de dataset.

Heb je vragen over dit bericht?

Je naam(Vereist)
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.

Jan Jonker M.A.

Advisor Data Projects