U bent hier: Home > Actueel > > Hebreeuwse tekstdatabase krijgt CLARIN-status

Hebreeuwse tekstdatabase krijgt CLARIN-status


In ronde vier van het Europese CLARIN-project is aan het project SHEBANQ de CLARIN-status toegekend. SHEBANQ staat voor System for HEBrew text: ANnotations for Queries and markup.

De Werkgroep Informatica van de theologie faculteit van de Vrije Universiteit heeft jarenlang gewerkt aan een tekstdatabase van het Hebreeuwse Oude Testament. Deze zogenaamde WIVU-database is in het bijbelwetenschappelijke veld tot een merknaam geworden en opgenomen in bijbelsoftware. Met de database kun je geavanceerd zoeken naar taalkundige patronen in de tekst. Het werk aan de database gaat door, het moet ook mogelijk worden te zoeken naar literaire patronen zoals de structuren van verhalen en argumentaties. Daarnaast is het belangrijk om de wijze waarop de teksten zijn overgeleverd goed in beeld te krijgen. Het NWO project Data and Tradition. The Hebrew Bible as a linguistic corpus and as a literary composition is bezig daar stappen in te zetten.

Ondertussen zijn de manieren waarop wij onderzoeksdata uitwisselen enorm veranderd. Je zou de vraag kunnen stellen hoe de moderne methoden de eeuwenoude traditie van interpretatie kunnen voortzetten. De makers van de WIVU-database willen een slag maken in het toegankelijk maken van de database voor andere wetenschappelijke onderzoekers, waarbij het werk dat door derden gebeurt ook echt zichtbaar wordt en blijft. De vraag is: hoe kan de WIVU-database hier een spilfunctie in vervullen?

CLARIN
Hier komt CLARIN om de hoek kijken. CLARIN is een Europees project, dat per land gefinancierd wordt. In Nederland wordt een aanzienlijk deel van het budget besteed aan projectrondes waarin de curatie van data centraal staat. CLARIN streeft ernaar dat talige materialen optimaal beschikbaar zijn voor onderzoek, en daartoe wijst het formaten en formalismen aan om data in uit te drukken, en houdt het registers bij waarin de betekenis van data en metadata expliciet gemaakt wordt. CLARIN's focus ligt op de taalkunde, en dat werkt twee kanten op: taalkundigen kunnen talig materiaal onderzoeken dat mogelijk niet door taalkundigen verzameld is, en anderen dan taalkundigen kunnen met behulp van taaltechnologie door taalbarrières heenbreken.

De WIVU-groep, onder leiding van prof. Wido van Peursen, gaat met DANS de tekstdatabase in Linguistic Annotation Framework zetten. Als bewijs dat de data daarmee interoperabel wordt, zal er een webapplicatie gebouwd worden die queries kan bewaren. Het idee is dat queries op de tekstdatabase die een bepaalde interpretatie ondersteunen, geciteerd kunnen worden in publicaties op zo’n manier dat wanneer je de link volgt, je meteen de query resultaten in context op je scherm krijgt. Dat vergt een goede samenwerking tussen onderzoekers en archieven.

Meer informatie
Meer weten over dit idee? Kijk op de  onderzoekspagina van DANS op Wiki of neem contact op met Dirk Roorda, onderzoeker bij DANS. Dirk is bereikbaar via +31 6 136 650 23 en dirk.roorda at dans.knaw.nl.
Gepubliceerd op: 21-12-2012