Gedigitaliseerde volkstellingen
Volkstellingen hebben een lange geschiedenis. In Nederland zijn volkstellingen gehouden vanaf 1795, veelal elke 10 jaar. Tot en met 1971 waren het in hoofdzaak traditionele tellingen, waarbij tellers van huis tot huis vragenlijsten invulden met de bewoners. Resultaten werden gepubliceerd in gedrukte vorm, in totaal zo’n 42.000 pagina’s over de periode 1795 – 1971. Vanaf 1997 zijn die publicaties in diverse projecten gedigitaliseerd. Sinds 2004 zijn alle tabellen in een digitaal verwerkbare vorm beschikbaar bij DANS.
Gedetailleerde gegevens van Volkstelling 1947
Naast de publicaties zijn van een aantal tellingen gedetailleerde gegevens bewaard bij het Centraal Bureau voor de Statistiek (CBS). Van de Volkstelling 1947 zijn dat ca. 30.000 bladen op A4 formaat met gegevens per gemeente en deels ook voor wijken en buurten binnen gemeenten. Het gaat over veel onderwerpen: van leeftijd en nationaliteit tot kerkgenootschap, van beroep tot forensisme en vele andere.
Methodiek om de massa gegevens herbruikbaar te maken
Eerder waren gescande images van de 30.000 bladen gemaakt. Met data-entry zijn die alle overgenomen in Excel werkbladen. De uitdaging was om die massa gegevens op zo’n manier te publiceren dat zij gebruikt kunnen worden in nieuw historisch onderzoek. In het artikel wordt uitvoerig beschreven op welke manier dat is gerealiseerd. Richtlijn was daarbij om de totale dataset FAIR te maken, met speciale aandacht voor de R van Reusable.
Voorbeeld van nieuwe analyse
De herbruikbaarheid van de gedetailleerde dataset voor Volkstelling 1947 wordt geïllustreerd met een voorbeeld. Het betreft het aantal personen zonder Nederlandse nationaliteit per 10.000 van de bevolking, per gemeente in 1947. Het artikel sluit af met een aantal mogelijkheden voor verder gebruik van de dataset.