Internet Archive: grootste webcrawl ooit

16 maart 2007

Het Internet Archive bereidt voor komende zomer een ‘historische’ webcrawl van 2 miljard pagina’s voor; dat is de grootste in haar geschiedenis. Met het oog op de komende megaoperatie is de organisatie op zoek naar webadressen van bibliotheken, archieven en cultureel-erfgoedinstellingen. Instellingen in die sfeer worden in een relatiemailing uitgenodigd om relevante url’s door te geven.

Het Archive is in het bijzonder op zoek naar ‘internationale web content uit zo veel mogelijk landen, regio’s en taalgebieden’. De megaoperatie waarin ze die wil betrekken is mogelijk gemaakt door de Amerikaanse Mellon Foundation, een stichting die subsidies geeft op het gebied van kunst, onderwijs, wetenschap en milieu. De foundation heeft een bedrag beschikbaar gesteld voor de verdere ontwikkeling van Heritrix, de open source webcrawler die door het Internet Archive is ontwikkeld en door bibliotheken en culturele instellingen over de hele wereld wordt gebruikt.

Heb je vragen over dit bericht?

Je naam(Vereist)
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.