Door AI gegenereerde tekst geeft mensen vaak het gevoel dat er iets niet klopt, of nep klinkt. Bij het lezen van menselijk Engels krijg je eerder het gevoel dat het een eigen stem of persoonlijk tintje heeft.
Wat zorgt er voor dat Engels menselijk klinkt, of juist als AI? En maakt het uit als AI-Engels nooit echt een menselijk gevoel bereikt?
Ik doe onderzoek naar de institutionalisering van het Engels. Hoe mensen meningen vormden over verschillende soorten Engels is een lang, problematisch verhaal, waarin het Engels dat bepaalde bevolkingsgroepen spraken in de loop van de geschiedenis werd gewaardeerd en er op het Engels dat andere groepen spraken juist werd neergekeken. Generatieve AI-taalgereedschappenmaken deze problemen groter. Op Engels gebaseerde grote taalmodellen worden getraind op tekst van internet. Menselijke instructies schrijven de modellen voor dat ze moeten klinken als formeel Engels. Daardoor worden grote taalmodellen uiteindelijk getraind op alle impliciete vooroordelen in gestandaardiseerde menselijke teksten en ideeën.
In mijn werk kom ik mensen tegen die er nooit op zouden vertrouwen dat wat op internet staat waar is maar die wel vertrouwen hebben in door AI gegenereerde Engelse teksten.Humaan versus AI
De eerste stap om een beter geïnformeerde gebruiker van AI-Engels te worden, is proberen te begrijpen wat de betekenis is van het ‘menselijk klinken’ van tekst. Dit inzicht zal bijdragen aan je AI-geletterdheid. Het belangrijkste is dat je twee kenmerken leert herkennen die menselijk Engels onderscheiden van AI-Engels: subtiele, taalkundige patronen van variatie en leesbaarheid.
AI gebruikt, wat ik noem, 'examen-Engels': een nogal formeel, compact Engels dat de voorkeur geniet in academische toetsen en papers. Het is minder gevarieerd en minder leesbaar. Mensen ervaren het als robotachtig, maar ze ervaren het ook als slim.
Hier is een snelle test: lees de twee onderstaande Engelstalige sms-berichten en raad welke van een mens is en welke van ChatGPT.
“i’m not sure how to break this to you. there’s no easy way to put it…i can’t make the friday-night fun. sorry. however, feel free to text me during the evening if there are any lulls in conversation. anyway, hope ur exotic trip goes well. see u next term.”
“Hey! I’m really sorry, but I won’t be able to make it Friday night. I hope you all have a great time, and I’ll see you next term!”
Een menselijke lezer merkt waarschijnlijk meteen verschillende patronen op. Het eerste bericht bevat meer 'sms-taal': het is standaard in kleine letters geschreven en bevat fonetische spellingen als 'ur' en 'u'. Het tweede bericht bevat hoofdletters, komma's en spelling zoals in een examen.
Mensen zullen waarschijnlijk ook andere indrukken hebben. Misschien voelt het eerste bericht persoonlijker aan, en minder zelfverzekerd. Misschien voelt de tweede tekst wat stijf aan, alsof hij door een kennis is geschreven. De eerste tekst bevat verschillende soorten zinnen en zinsdelen, terwijl de tweede tekst vier keer dezelfde zinsstructuur herhaalt.
Op een bepaald niveau pikken menselijke lezers zulke patronen op. De meeste mensen zouden zeggen dat de eerste tekst door een mens is geschreven en de tweede door AI. Inderdaad, de tweede passage is gegenereerd door ChatGPT.
Zelfs deze eenvoudige illustratie laat zien dat menselijk Engels varieert in woordgebruik en grammaticale structuren, waardoor informatie wordt opgedeeld en een persoonlijke betekenis wordt overgebracht. AI-Engels kent minder variatie en bevat meer compacte naamwoordgroepen. In wetenschappelijke onderzoeken komen deze patronen herhaaldelijk voor in verschillende genres en registers.
Patronen in AI-Engels veranderen
AI-schrijfhulpmiddelen evolueren voortdurend. En grote taalmodellen verschillen onderling. GPT-5 klonk bijvoorbeeld berucht om zijn koele toon in vergelijking met zijn voorganger GPT-4.
Maar de patronen waarover ik spreek, zullen waarschijnlijk blijven bestaan. AI-Engels geeft de voorkeur aan wat examen-Engels altijd al heeft beloond: homogeniteit en informatiedichtheid. En tot nu toe zorgt instructieve afstemming – het trainen van AI-modellen om menselijke instructies te volgen – er alleen maar voor dat AI-Engels minder op menselijk Engels lijkt. Het helpt ook niet dat AI-schrijven deel uitmaakt van de training van AI-bots.
Het netto-effect is momenteel dat AI-Engels is getraind op Engels dat in de praktijk veel beperkter is dan het Engels zoals wij mensen het in de praktijk spreken en schrijven. Wij gebruiken niet alleen taal die waarschijnlijk is, maar ook taal die mogelijk is. Het is gebaseerd op het gevarieerde taalgebruik dat we hebben gehoord en gelezen, op ons creatieve vermogen voor nieuwe uitingen en onze neiging om persoonlijke en onpersoonlijke taalpatronen te vermengen.
AI-modellen kunnen conventioneel correcte, slim klinkende taal produceren, maar die taal mist de variatie, toegankelijkheid en creativiteit die taal menselijk maken.
Naast elkaar bestaan
Als we ons meer bewust worden van de verschillen tussen AI- en menselijk Engels, kunnen die inzichten helpen beide taalvormen beter te benutten. Hier zijn een paar dingen die je kan doen:
Gebruik taalkundige labels
Gebruik bij het beschrijven van een bepaalde tekstfragment labels als ‘compact’, ‘eenvoudig’, ‘interpersoonlijk’ of ‘informatief’, en geen sociale labels als ‘klinkt slim’ of ‘klinkt vreemd’. Probeer de feitelijke patronen in menselijk en AI-Engels te onderzoeken en beschrijf taalpatronen, niet de gevoelens die ze oproepen.
Gebruik AI-tools selectief
Menselijk Engels heeft niet alleen meer toegankelijke patronen met meer variatie, het spreekt ook de hersenen meer aan dan het gebruik van AI-taaltools. Gebruik AI selectief om te voorkomen dat AI-Engels de gevarieerde menselijke taal in de wereld verdringt
Gebruik zorgvuldig geselecteerde tools
Kleine taalmodellen en programma's die je aan een webbrowser kunt toevoegen om vooringenomenheid te traceren, zoals Bias Shield, kunnen mensen helpen principiële keuzes te maken over inzet van AI-Engels. Gereedschappen zoals vertaalbots kunnen ook veel meer van de wereldwijde variatie in menselijk Engels verwerken in AI-Engels.
Wees je bewust van wat slim klinkt en waarom
Anderhalve eeuw examen-Engels zou je kunnen doen geloven dat compacte, onpersoonlijke schrijfpatronen slim zijn. Maar net als alle taalpatronen hebben ze voor- en nadelen. Ze zijn niet bijzonder toegankelijk of leesbaar, zeker niet voor een divers publiek, en ze zijn niet representatief voor het spectrum van het wereldwijde Engels dat tegenwoordig gangbaar is
Er bestaan goede redenen om examen-Engels te gebruiken, maar dat AI-bots het genereren, of dat het mensen die het spreken of schrijven slim doet lijken behoren daar niet toeniet.
In het beste geval is AI-Engels een door statistieken aangestuurde taaldatabase. Het is omvangrijk maar voorgeprogrammeerd. De geschiedenis leert ons dat het volledige spectrum van Engels zoals het door mensen wordt gebezigd de meeste mogelijkheden biedt voor expressie en verbinding.
*) Laura Aull (foto boven) is hoogleraar English and Linguistics aan de University of Michigan. Het origineel van dit artikel verscheen bij The Conversation