Onafhankelijke journalistiek over de Vrije Universiteit Amsterdam | Sinds 1953
18 juli 2024

Wetenschap
& Onderwijs

Taal is één groot mysterie voor computers

Piek Vossen, hoogleraar computers en taal, heeft geen enkele moeite om de volle zaal in Pakhuis De Zwijger te overtuigen van het feit dat taal heel complex is. Voor computers is het helemaal lastig om taal te begrijpen. Aan de hand van items als meerduidigheid, context, variatie, grammatica, sociaal gedrag en vaagheid legt hij de enorme gelaagdheid van taal bloot. Het publiek reageert via smartphones op zijn stellingen. Al snel wordt het duidelijk: het is fundamenteel onmogelijk om betekenis volledig weer te geven en/of te begrijpen. “Bijvoorbeeld hoe wij deze publiekslezing op Goede Vrijdag ervaren. Dat kunnen we slechts bij benadering verwoorden”, aldus Vossen.

Meer dan 2 miljard betekenissen

Als voorbeeld laat hij de volgende drie zinnen zien: De band speelt buiten op het veld. Ze hebben er zin in. Bij de eerste slag slaat de drummer zijn stokken al stuk. Het publiek raadt naar de hoeveelheid betekenissen van woorden als spelen en slag. Het blijken er twaalf voor spelen, en achttien voor slag. Wanneer je alle betekenissen in deze drie zinnen combineert, kom je uit op meer dan 2 miljard betekenissen. Kan het meerduidiger?

Halvezool

En dan: hoeveel woorden heeft het Nederlands om het over iemand te hebben? 8.643 Nederlandse woorden zijn er om een persoon te duiden. Een losse greep: joker, woelgeest, satan, zwijnjak,galgebrok, halvezool, mafkees, kwibus, lijpo, schurk… En zo kan Vossen nog even doorgaan.

Nog meer voorbeelden volgen. De parkeerverordening Hilversum 2014 laat zien hoe moeilijk het is om exact de informatie weer te geven. Het Centrum Basiseducatie Vilvoorde/Brussel heeft de volgende opdracht: welk kaartje hoort bij deze tekst? Ook dat blijkt niet eenvoudig.

Belubberen

Belubberen, vekken, blakken en mukken. Het duizelt van de voorbeeldwoorden om aan te geven hoe moeilijk het is om een taal te begrijpen. Want ‘vage, ambigue en variabele taal is de minimale uitdrukking van informatie binnen een gegeven context.’ (Bron: Grice, 1975). Juist ja.

Public Science

Public Science is een lezingenserie over wetenschap voor een breed publiek, georganiseerd door de VU, in samenwerking met Advalvas, Pakhuis De Zwijger en wetenschapsblad Quest. Dit jaar staan er nog drie lezingen op het programma. De volgende lezing is op maandag 28 april: Hack de toekomst, interactief theaterdebat over cybercrime en witte hackers, met hoogleraar systeem- en netwerkbeveiliging Herbert Bos en theatergroep Mens in de Maak.

Reageren?

Houd je bij het onderwerp, en toon respect: commerciële uitingen, smaad, schelden en discrimineren zijn niet toegestaan. Reacties met url’s erin worden vaak aangezien voor spam en dan verwijderd. De redactie gaat niet in discussie over verwijderde reacties.

Velden met een * zijn verplicht
** je e-mailadres wordt niet gepubliceerd en delen we niet met derden. We gebruiken het alleen als we contact met je zouden willen opnemen over je reactie. Zie ook ons privacybeleid.