Er is een nieuwe controverse ontstaan ​​in de strijd om door AI gegenereerde inhoud te identificeren. Een softwareontwikkelaar beweert SynthID te hebben reverse-engineered, het geavanceerde watermerksysteem van Google DeepMind dat is ontworpen om door AI gegenereerde media te taggen. Hoewel de ontwikkelaar zijn bevindingen openlijk heeft vrijgegeven, beweert Google dat het systeem robuust en effectief blijft.

De doorbraak: hoe “Aloshdenny” de code kraakte

Een ontwikkelaar die het pseudoniem Aloshdenny gebruikt, heeft op GitHub en Medium een methode gedocumenteerd om de onzichtbare watermerken van Google te identificeren en te manipuleren. In tegenstelling tot veel exploits op hoog niveau, vereiste deze aanpak geen enorme rekenkracht of toegang tot de eigen code van Google. In plaats daarvan vertrouwde het op slimme signaalverwerking en een grote dataset van door Gemini gegenereerde afbeeldingen.

Volgens de ontwikkelaar omvatte het proces:
‘Lege’ afbeeldingen analyseren: Door honderden ‘puur zwarte’ of ‘puur witte’ afbeeldingen te genereren via Gemini, ontdekte de ontwikkelaar dat het watermerk nog steeds aanwezig was in de pixelgegevens.
Signaalextractie: Door het contrast te verbeteren en de ruis in deze afbeeldingen te verminderen, werden de watermerkpatronen zichtbaar als wiskundige signalen.
Frequentietoewijzing: De ontwikkelaar heeft deze patronen gemiddeld om de specifieke “omvang en fase” van het watermerk over verschillende frequenties te identificeren.
Interferentie: Zodra het signaal werd begrepen, kon de ontwikkelaar op zoek gaan naar die specifieke frequenties in andere afbeeldingen om deze gedeeltelijk te verstoren.

Wat is SynthID en waarom is het belangrijk?

Om de inzet te begrijpen, moet men de technologie begrijpen. SynthID is een “bijna onzichtbare” watermerktool. In plaats van een zichtbaar logo toe te voegen, wordt een digitale handtekening direct in de pixels van een afbeelding ingebed op het moment van creatie.

Deze technologie is om verschillende redenen van cruciaal belang:
De strijd tegen deepfakes: Het biedt een manier om onderscheid te maken tussen echte fotografie en door AI gegenereerde beelden.
Contentherkomst: Het helpt platforms zoals YouTube door AI gegenereerde klonen van makers en andere synthetische media bij te houden.
Verantwoording: Hiermee kunnen ontwikkelaars een digitaal spoor bijhouden van wat hun modellen produceren.

Het doel van dergelijke systemen is zelden om een ​​’onbreekbaar’ schild te creëren, maar eerder om de “kosten van misbruik” te verhogen. Als het verwijderen van een watermerk geavanceerde wiskundige kennis en aanzienlijke inspanningen vereist, zullen de meeste gewone gebruikers ervan worden weerhouden het te omzeilen.

Het oordeel: een fout in het systeem of een triomf van de techniek?

De resultaten van dit experiment zijn genuanceerd. Aloshdenny geeft toe dat ze het watermerk niet volledig konden “verwijderen”. In plaats daarvan was de methode succesvol in het verwarren van de decoders (de tools die worden gebruikt om de watermerken te lezen) waardoor ze faalden of het opgaven bij het scannen van een afbeelding.

Google heeft de claims snel afgewezen. In een verklaring aan The Verge beweerde woordvoerder Myriam Khan:

“Het is onjuist om te zeggen dat deze tool systematisch SynthID-watermerken kan verwijderen. SynthID is een robuuste, effectieve watermerktool voor door AI gegenereerde inhoud.”

De bredere context

Deze ontwikkeling benadrukt de voortdurende ‘wapenwedloop’ tussen AI-ontwikkelaars en degenen die de veiligheidsrails proberen te omzeilen. Naarmate AI-modellen beter in staat worden hyperrealistische inhoud te genereren, moeten de methoden die worden gebruikt om die inhoud te labelen voortdurend evolueren.

Hoewel de methode van Aloshdenny nog geen ‘één-klik’-tool voor het grote publiek is, toont het aan dat zelfs onzichtbare, wiskundig ingebedde watermerken kwetsbaar zijn voor specifieke signaalanalyse.

Conclusie
Hoewel Google volhoudt dat zijn SynthID veilig blijft, bewijst de mogelijkheid om het detectiemechanisme te verstoren dat geen enkel digitaal watermerk echt onoverwinnelijk is. Dit incident onderstreept de moeilijkheid van het behouden van een permanente, betrouwbare herkomst in een tijdperk van snel voortschrijdende synthetische media.