Europese Commissie maakt miljoen zinnen in 22 talen beschikbaar

1 februari 2008

De grootste collectie ooit in zoveel talen tegelijk. Zo noemt de Europese Commissie de verzameling van een miljoen zinnen en hun ‘hoogkwalitatieve vertalingen’, die ze sinds kort gratis beschikbaar stelt.

De data kunnen worden gebruikt voor het ontwikkelen van automatische vertaalsystemen, online woordenboeken, spellingcheckers en tekstclassificatiesystemen, zegt de Commissie. Instituties van de EU hebben meer meertalige teksten dan enige andere organisatie vanwege de eis dat wetgeving van de Unie moet worden vastgelegd in elk van de drieëntwintig talen van lidstaten. Vertaaldiensten van de EU werken met 253 mogelijke combinaties van talen en produceren zo’n anderhalf miljoen pagina’s per jaar. Vertalingen van Engelse of Franse teksten zijn legio te vinden op het internet maar dat geldt veel minder voor kleinere talen zoals Lets of Roemeens en al helemaal niet voor combinaties van zulke talen. Daarom gaan de vertalers en de eigen wetenschappelijke medewerkers van de Commissie nu samenwerken om grote hoeveelheden zinnen in 22 talen beschikbaar te maken uit wetgerelateerde documenten op technisch, politiek en sociaal gebied. In de opgebouwde repository kunnen dan zinnen worden gezocht met hun vertaling in alle andere officiële EU-talen. Alleen Ierse vertalingen zijn nog niet beschikbaar.
Commissaris Potochnik van Wetenschap en Onderzoek noemt het EU-initiatief in een bericht een ‘bijdrage aan een nieuwe generatie van software tools voor vertaalprocessen, die de concurrentiekracht van de vertaalindustrie in de EU een impuls zal geven’.

Heb je vragen over dit bericht?

Je naam(Vereist)
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.