Wordt het internet overspoeld door AI-gegenereerde afbeeldingen?

Forse toename van AI-beelden vervuilt informatiestromen

In januari 2024 waarschuwde ik voor de naderende vloedgolf van synthetische media die het komende decennium de grenzen tussen echte en nepcontent op het internet zou doen vervagen. Dit dreigt nu al bewaarheid te worden.

In mijn boek 'De AI Revolutie' onderzoek ik hoe deze golf van AI-gegenereerde media zowel onze digitale als fysieke wereld zou kunnen beïnvloeden. Onlangs deed een bericht op X me afvragen hoe wijdverspreid synthetische media nu al zijn op het internet.

De X-post bevatte een zoekopdracht naar afbeeldingen van een babypauw, waarvan een groot deel duidelijk door AI waren gegenereerd. Het onderschrift luidde: "Google está muerto", wat volgens mij vertaald kan worden als "Google is dood".

Afbeelding met schermopname, software, Webpagina, Website Automatisch gegenereerde beschrijving

Tijd voor eigen onderzoek

Hoewel ik betwijfel of AI-gegenereerde afbeeldingen louter Google zullen doden, wordt duidelijk dat we de digitale wereld bijna net zozeer vervuilen als onze fysieke wereld. Maar in welke mate doen we dat? En gaat het alleen om babypauwen? En wat kunnen we doen om dat te stoppen?

Met een paar vrije uurtjes begon ik te coderen op 9 oktober 2024. Ik schraapte en analyseerde duizenden Google-zoekresultaten naar baby- en volwassen dieren, met behulp van Playwright, een Python-bibliotheek voor web scraping/webtesting. Ik deed dat in verschillende talen (Nederlands, Engels, Frans, Duits, Italiaans, Portugees, Russisch en Spaans).

Duizenden afbeeldingen heb ik handmatig ingedeeld in drie categorieën: ‘nep’ (door AI gegenereerd), ‘echt’ en ‘onbekend’. Ik maakte gebruik van Streamlit-app. Dankzij rapid prototyping, mogelijk gemaakt door LLM-gedreven codering, duurt het maken van zulke tools nu slechts enkele seconden.