CLIN 2014: lexicologie en de mogelijkheden van Big Data

23 januari 2014

Op 17 januari organiseerde het Instituut voor Nederlandse Lexicologie (INL) samen met de TST-Centrale de 24e editie van ‘Computational Linguistics in the Netherlands’ (CLIN) in Leiden. DANS was één van de sponsors.

De bijeenkomst was bedoeld voor iedereen die zich bezighoudt met taal- en spraaktechnologie en haar toepassingen. CLIN telde maar liefst 15 sessies met 60 papers. Vanuit DANS/TLA spraken Menzo Windhouwer en Ineke Schuurman (KU-Leuven) over registers van (taal)wetenschappelijke termen waarmee onderzoeksmateriaal beschreven kan worden (ISOcat en Relcat) en presenteerde Dirk Roorda met Martijn Naaijer (VU-Amsterdam) een nieuw instrument om onderzoek te doen naar taalvariatie in het bijbels Hebreeuws. Andere sessies liepen uiteen van historische data via lexicologie en semantiek naar de industrie.

Keynote sprekers Hanks en Geeraerts
De spannende vraag was ‘hoe de lexicologie het beste in kan spelen op de mogelijkheden die Big Data bieden’. De corpora worden groter, raken beter geannoteerd en zijn beter doorzoekbaar geworden. Veel papers vandaag de dag rapporteren bijdrages hieraan. Aan de andere kant is de lexicologie steeds beter gaan beseffen dat een oud ideaal, namelijk het beschrijven van discrete woordbetekenissen, aan richtinggevende kracht verloren heeft. Keynote spreker lexicoloog Patrick Hanks (University of Wolverhampton) verwoordde het als volgt: ‘een woord heeft geen betekenis, maar een betekenispotentieel, en dat potentieel wordt pas gerealiseerd door de patronen waarin het voorkomt’. De tweede keynote spreker lexicoloog Dirk Geeraerts (Leuven University) maakte duidelijk dat de informatie over woordgebruik, zoals we dat uit de diverse corpora krijgen, meteen het scherpe onderscheid uitwist tussen vaste grond en trends in woordbetekenissen.

Organisatoren CLIN24
CLIN24 werd georganiseerd door het INL en de TST-Centrale. Het INL is de plek voor iedereen die iets wil weten over woorden, hun spelling, vorm, betekenis of gebruik door de eeuwen heen. De TST-Centrale is het kennis- en distributiecentrum voor Nederlandstalige tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software.

Meer informatie
Meer informatie over de bijeenkomst staat op de CLIN-website. DANS was een van de sponsors van CLIN. Neem bij vragen contact op met Menzo Windhouwer. Menzo is bereikbaar via menzo.windhouwer [at] dans.knaw.nl.

Afbeelding: De Universiteit Leiden bood onderdak aan CLIN24. Credits: Boukje Verheij

Heb je vragen over dit bericht?

Je naam(Vereist)
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.