DBNL biedt nu ook PDF’s

4 juni 2010

De Digitale Bibliotheek der Nederlandse Letteren (DBNL) blijkt al enige tijd tekst in beeldvorm (als PDF) en teksten als resultaat van automatisch lezen (OCR) beschikbaar te stellen. Dat staat in het vandaag verschenen juninummer van het kwartaalblad e-data&research.
 
De DBNL heeft daarmee de steven gewend. De digitale biliotheek stond er altijd bekend om alleen nauwkeurig met de hand overgetypte digitale teksten aan te bieden omdat slechts die de vereiste kwaliteit en betrouwbaarheid bij het digitaal doorzoeken konden bieden.
Hoofdredacteur René van Stipriaan zegt in het blad: ‘We zijn overgestapt op een beleid met twee snelheden. Grote hoeveelheden tekst worden vooruit gescand en via OCR ter beschikking gesteld. Eind dit jaar zijn er twee miljoen pagina’s ongecorrigeerde tekst, ongeveer net zo veel als de hoeveelheid pagina’s die op de klassieke manier beschikbaar is. Eind 2012 zullen er tien miljoen pagina’s zijn gescand. De betrouwbare tekst en de webweergave op basis van XML volgt later’.
Ook nieuw is dat de DBNL rechtenvrije teksten beschikbaar gaat stellen via printing-on-demand en in verschillende formaten als e-book.

Heb je vragen over dit bericht?

Je naam(Vereist)
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.