22 juni 2024

Taalbeheersing en AI

Menselijke creativiteit en genialiteit uiten we in de vorm van praten, schrijven of kunstige handvaardigheden. Communicatiemogelijkheden waarmee de mens de wereld om zich heen kan beïnvloeden en veranderen. Gereedschap en techniek verbetert, versterkt en perfectioneert die aangeboren menselijke vaardigheden. Zoals een fiets ons met dezelfde spierkracht sneller kan laten bewegen. Of een telraam ons sneller kan laten rekenen. Of een kwast ons mooiere afbeeldingen laat maken. Door toevoeging van energie, zoals ooit de stoommachine en later verbrandingsmotor en elektriciteit, kunnen we die vaardigheden zelfs ordes van grootte versterken. De ontwikkeling van grote taalmodellen versterkt onze vaardigheid in schrijven en het bijbehorende lezen. Computer ondersteunde taalmodellen kunnen taal, ons menselijk communicatiemiddel, enorm versterken en perfectioneren. En – belangrijker nog – kunnen we informatie en kennis die we digitaal hebben vastgelegd, in menselijke vorm gaan gebruiken. De computer kan nu ‘menselijk’ schrijven en lezen en hiervan afgeleid, ook menselijk praten en luisteren. En de computer ons wéér een beetje beter ondersteunt.
Taalbeheersing en AI image

Wat is een ‘groot taalmodel’?

Een groot taalmodel is een taalmodel dat zich onderscheidt doordat het voor algemene doeleinden tekst kan genereren: zogenaamde ‘generatieve kunstmatige intelligentie’. Omdat het generiek inzetbaar is, wijkt het af van gewone taalmodellen die alleen voor specifieke doelen inzetbaar zijn. Taalmodellen leggen diepe, statistische relaties tussen woorden en het gebruik daarvan. Door deze ‘taalvaardigheid’ lijkt het steeds meer of een mens de conversatie voert. Door op deze basis teksten te genereren, waarbij het model ook nog toegang heeft tot specifieke informatie of kennis, kan de computer ons op ‘menselijke wijze’ over die informatie en kennis informeren. Specifieke informatie en content de we als mens niet zelf meer hoeven te ‘genereren en vast te leggen’, maar direct vanuit de computer kunnen gebruiken.

Grote taalmodellen hebben kennis van zowel syntaxis (taalkunde of zinsleer) en semantiek (betekenisleer). Syntaxis is alles wat te maken heeft met de opbouw, structuur en ‘verbindbaarheid’ van zinsdelen en zinnen: hoe schrijf je een logische zin. Semantiek houdt zich bezig met de betekenis van symbolen, woorden en groepen van woorden: welke boodschap staat in die zin. Hier speelt morfologie een rol: morenen zijn de kleinste ‘betekenisdragende’ eenheden in een woord. De kleinste bouwstenen van hoe een taal is opgebouwd en die bij alle talen in de tijd de meeste stabiele elementen blijven. Een bouwsteen voor zowel klankleer, spraakleer als taalverandering. Het taalmodel werkt wel met de context maar heeft zelf géén besef van enige betekenis en heeft als zodanig ook geen enkele vorm van menselijke intelligentie. Daarom geldt de definitie ‘kunstmatige’ intelligentie voor de logische wijze hoe een computer schijnbare intelligentie toont.

Taalvaardigheid

Taalvaardigheid is het vermogen om te luisteren, spreken, lezen en schrijven in zowel samenhang als continuïteit. Taalvaardigheid stelt een persoon in staat taal te gebruiken in het dagelijkse leven. Daarnaast geeft het ons het vermogen om gedachten, ideeën, meningen en informatie vanuit de eigen kennis en gedachten met de buitenwereld te communiceren. Taalvaardigheid staat in directe relatie met de woordenschat die een persoon in de betreffende taal heeft. Immers woorden zijn bouwstenen van elke taal. Hoe meer woorden iemand ter beschikking heeft, hoe genuanceerder iemand zijn gedachten kan vormen en uiten.

Ieder mens heeft meestal de grootste woordenschat in de taal waarmee hij of zij is opgegroeid, de moedertaal. Het is de taal die tijdens de jeugd, zonder formeel taalonderwijs, spelenderwijs wordt verworven. Bijzonder is dat in de moedertaal, het aantal intuïties over hoe iets wel en niet gezegd wordt, het hoogst is en alleen in de jonge jaren wordt geleerd. In de taalkunde wordt de puberteit doorgaans als afsluiting beschouwd van de periode waarin ‘moedertaalverwerving’ mogelijk is. Een taal die daarna wordt geleerd – een tweede taal – heeft doorgaans naast een kleinere woordenschat ook minder intuïviteit over hóe de taal te gebruiken. Hoe goed iemand een tweede taal ook leert spreken, het niveau van de eigen moedertaal wordt nooit meer bereikt. Aan accent, zinsopbouw, woordkeuze en grammaticale fouten horen moedertaalsprekers altijd duidelijk dat het niet de moedertaal van de spreker is.

Gedachten en creativiteit uiten

Het formuleren en spreken in de moedertaal is altijd de meest genuanceerde wijze hoe iemand zijn kennis, gevoelens en ideeën kan uiten en overdragen. De meeste volwassenen hebben een woordenschat van 20.000 tot 40.000 woorden, minder dan 10% van de ruim 430.000 woorden die de Nederlandse taal heeft. In het dagelijks verkeer gebruiken daar weer 10% van, ongeveer 2000 woorden. De Engelse taal heeft van de westerse talen de meeste woorden, ongeveer 750.000. Zij hebben vele extra woorden voor begrippen, situaties en gevoelens waar wij in het Nederlands zelfs geen woord voor hebben. Ondanks dat wij als Nederlander vaak goed Engels kunnen spreken, zullen we ons nooit zo goed in die taal kunnen uiten. Daar komen taalmodellen ons te hulp: zij hebben die geleerde woordenschat en intuïtie wel.

Je kunt als Nederlander proberen je gedachten en ideeën direct te formuleren in bijvoorbeeld het Engels. Echter de variatie en nuancering die je in het Nederlands kunt aanbrengen, zal altijd veel groter zijn. Daarom is er ook discussie over docenten die niet in hun moederstaal doceren. De kennisoverdracht die ze ‘kunnen’ realiseren, zal altijd beperkter zijn dan wanneer zij die overdracht in hun moedertaal zouden doen. Dat is ook de reden dat ik het Nederlands blog, hoe vaak mensen mij ook hebben gevraagd dat direct in het Engels, een tweede taal voor mij, te doen. En oude vertaalsystemen waren altijd gebrekkig en vertaalden een tekst vrij primitief.

Taalmodellen als hulpmiddel

Maar de laatste nieuwe taalmodellen kunnen teksten die zijn geschreven in een moedertaal, nu vaak met alle variaties en nuanceringen, perfect vertalen in een andere taal. Onder mijn Nederlandstalige blogs, plaats ik sinds een jaar ook standaard een ChatGPT-vertaling in het Engels die in mijn ogen nu inderdaad de variatie en nuances, en dus de kwaliteit heeft, die ik in elke tekst probeer aan te brengen. Dat geldt natuurlijk voor alle andere talen die intussen op deze wijze met de computer kunnen worden vertaald. Men zegt wel eens dat schrijven in je moedertaal ‘recht uit je hart komt’ en zo zonder na te denken op natuurlijke wijze je gedachten op papier zet.

De fantastische nieuwe taalmodellen stellen ons in staat ‘to write like any native’, mits we eerst onze eigen tekst in onze moedertaal hebben geschreven. Onze gedachten en nuanceringen in de zinnen hebben kunnen zetten. Niet mechanisch maar op een natuurlijke wijze onze gedachten en boodschappen ‘vanuit het hart’ op papier zetten. Daar gaat immers ‘kunstmatige intelligentie’ mis: een computer heeft geen hart. Heeft geen emotie, passie, geloof en overtuiging.

Peter Hinssen schreef in ‘Het einde van afgrijselijk’ al dat computer-gecorrigeerde taal zo saai en mechanisch is, dat het snel irriteert. Foutloos geschreven lappen tekst zonder boodschap. Zonder gepassioneerde inhoud. Zonder enige menselijkheid. Prima voor handleidingen, trainingen, software en andere zakelijke maar emotieloze teksten. Niet uitnodigend om te lezen. Al snel zó irritant, dat je het opzij legt en liever een goed, spannend geschreven artikel of boek pakt. AI is een gereedschap, maar levert nooit de menselijke creativiteit en passie die normale communicatie zo levendig en spannend maakt. Dus laat ChatGPT nooit je sollicitatiebrieven, je persoonlijke brieven en zeker niet je liefdesbrieven schrijven . . . voor de ervaren lezer en schrijver, val je direct door de mand.

Door: Hans Timmerman (foto)

Dutch IT Security Day BW tm 15-10-2024 DIC Awards BW tm 21-10-2024
Gartner BN en BW tm 03-11-2024