De Dode Zee Rollen gaan Open Access

13 mei 2019

Sinds kort staat de tekst van de Dode Zee rollen open online, met inbegrip van een rijke verzameling linguïstische annotaties.

De Dode Zee Rollen (DSS, Dead Sea Scrolls) is een verzameling boekrollen die halverwege de vorige eeuw in woestijngrotten bij Qumran gevonden zijn. Ze blijken onder andere bijbels tekstmateriaal te bevatten en ze zijn ouder dan tot dan toe overgeleverde manuscripten.

Decennialang waren de rollen maar beperkt toegankelijk, en een select groepje geleerden bewaakte de toegang angstvallig, maar ze publiceerden wel een concordantie. In de 90er jaren van de vorige eeuw destilleerde bijbelwetenschapper Martin Abegg daaruit de ongepubliceerde transcripties en doorbrak daarmee het monopolie. Sindsdien zijn de transcripties commercieel uitgegeven door bijbelsoftware producent Accordance en uitgever Brill. Nog steeds hadden onderzoekers geen goede mogelijkheden om computer-ondersteund onderzoek te doen op het materiaal.

Een unieke samenwerking tussen Jarod Jacobs, Martijn Naaijer (promovendus VU) en Dirk Roorda (DANS) heeft er toe geleid dat Abegg zijn data belangeloos ter beschikking heeft gesteld, en dat Jarod, Martijn en Dirk het materiaal hebben verwerkt tot een onderzoekbare dataset op GitHub. Niet alleen staat die data daar, maar omdat GitHub zelf weer gearchiveerd wordt door het Software Heritage Archive in Parijs, zijn de rollen ook daar bewaard. Als klap op de vuurpijl is het materiaal ook nog gearchiveerd bij Zenodo, een dienst van CERN, Genève.

Wie aan de slag wil met deze dataset, kan het beste Text-Fabric installeren. Daarna is het nog maar één commando om oog in oog te staan met de tekst van de Dode Zeerollen. Als Python3 geinstalleerd is, volstaat dit:

pip3 install text-fabric

text-fabric dss

Voor Martijn Naaijer en Jarod Jacobs is de volgende stap om verder onderzoek te doen naar de variaties tussen de tekstbronnen van de Hebreeuwse Bijbel om zo de ontstaansgeschiedenis van de tekst en de ontwikkeling van de taal beter in kaart te brengen. Zij doen dat in het project  Creating Annotated Corpora of Classical Hebrew Texts (CACCHT) project samen met Robert Rezetko, Oliver Glanz en Wido van Peursen.

Voor DANS en Dirk Roorda betekent dit een volgende stap in de logistiek van het onderzoeken van historisch tekstmateriaal. Er zijn al verschillende andere corpora in Text-Fabric gezet, zoals de Koran en Oud-Babylonische brieven (kleitabletten). Dit helpt onderzoekers die “digitaal” willen gaan om met minder strubbelingen de computer in te zetten bij hun onderzoek. Het helpt als collega’s in andere talen dezelfde technieken gebruiken, want het is geen sinecure om data zo te verwerken dat de herkomst duidelijk blijft en bronnen en resultaten langdurig beschikbaar te houden.

Meer informatie

Op 9 juli aanstaande zal de workshop “From Manuscript to Text Analytics”, onderdeel van de DH2019 conferentie in Utrecht, hands-on gaan met de genoemde corpora.

Heb je vragen over dit bericht?

Je naam(Vereist)
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.