In mijn boek 'De AI Revolutie' onderzoek ik hoe deze golf van AI-gegenereerde media zowel onze digitale als fysieke wereld zou kunnen beïnvloeden. Onlangs deed een bericht op X me afvragen hoe wijdverspreid synthetische media nu al zijn op het internet.
De X-post bevatte een zoekopdracht naar afbeeldingen van een babypauw, waarvan een groot deel duidelijk door AI waren gegenereerd. Het onderschrift luidde: "Google está muerto", wat volgens mij vertaald kan worden als "Google is dood".
Tijd voor eigen onderzoek
Hoewel ik betwijfel of AI-gegenereerde afbeeldingen louter Google zullen doden, wordt duidelijk dat we de digitale wereld bijna net zozeer vervuilen als onze fysieke wereld. Maar in welke mate doen we dat? En gaat het alleen om babypauwen? En wat kunnen we doen om dat te stoppen?
Met een paar vrije uurtjes begon ik te coderen op 9 oktober 2024. Ik schraapte en analyseerde duizenden Google-zoekresultaten naar baby- en volwassen dieren, met behulp van Playwright, een Python-bibliotheek voor web scraping/webtesting. Ik deed dat in verschillende talen (Nederlands, Engels, Frans, Duits, Italiaans, Portugees, Russisch en Spaans).
Duizenden afbeeldingen heb ik handmatig ingedeeld in drie categorieën: ‘nep’ (door AI gegenereerd), ‘echt’ en ‘onbekend’. Ik maakte gebruik van Streamlit-app. Dankzij rapid prototyping, mogelijk gemaakt door LLM-gedreven codering, duurt het maken van zulke tools nu slechts enkele seconden.