OpenAI onderbreekt expliciete chatbotfunctie vanwege veiligheidsproblemen

OpenAI heeft de release van de geplande “Adult Mode” voor ChatGPT uitgesteld na interne waarschuwingen over mogelijke schade en ontoereikende waarborgen, volgens een nieuw rapport van de Wall Street Journal. De functie, ontworpen om gebruikers in staat te stellen seksueel expliciete gesprekken te voeren, werd opgeschort nadat de welzijnsadviesraad van OpenAI unanieme zorgen had geuit.

De risico’s wogen groter dan de beloningen

Psychologen en cognitieve wetenschappers binnen de adviesraad waarschuwden dat de functie ongezonde emotionele afhankelijkheid onder gebruikers zou kunnen bevorderen – een probleem dat al werd waargenomen bij standaard ChatGPT-interacties. Eén deskundige waarschuwde naar verluidt dat de chatbot zelfs een hulpmiddel zou kunnen worden om zelfbeschadiging aan te moedigen, door op te treden als een ‘sexy zelfmoordcoach’. Deze alarmerende beoordeling speelde een sleutelrol bij het besluit om de ontwikkeling te onderbreken.

Mislukte leeftijdsverificatie

Als aanvulling op deze zorgen bleek dat de leeftijdsverificatiesystemen van OpenAI onbetrouwbaar waren. Uit eerste tests bleek een foutenpercentage van 12% bij het correct identificeren van minderjarige gebruikers, wat betekent dat miljoenen kinderen mogelijk ongemerkt toegang zouden kunnen krijgen tot ongepaste inhoud. Deze mislukking weerspiegelt eerdere schandalen bij Meta, dat kritiek kreeg vanwege het lakse veiligheidsbeleid in zijn eigen AI-chatbots. Meta heeft sindsdien zijn beleid bijgewerkt, maar staat nog steeds ‘romantisch rollenspel’ tussen gebruikers en AI-avatars toe.

Expliciete inhoud in evenwicht brengen met veiligheid

OpenAI beweert dat het van plan is om uiteindelijk de Adult Mode te lanceren, maar het bedrijf worstelt nog steeds met de manier waarop expliciete inhoudsbeperkingen kunnen worden opgeheven en tegelijkertijd schadelijke resultaten kunnen worden voorkomen, zoals niet-consensuele handelingen of materiaal met seksueel misbruik van kinderen. Een woordvoerder verklaarde dat de functie gesprekken op ‘vuile toon’ mogelijk zou maken, die niet in de buurt komen van regelrechte pornografie. Ze verdedigden ook het foutenpercentage bij de leeftijdsverificatie als ‘industriestandaard’ en erkenden dat waterdichte nauwkeurigheid onmogelijk is.

Grotere context: de evoluerende prioriteiten van OpenAI

De vertraging komt op een moment dat OpenAI zijn strategie herijkt te midden van juridische strijd, de ontwikkeling van GPT-5.4 en toegenomen overheidscontracten. De prioriteiten van het bedrijf zijn verschoven en de functie Volwassenemodus lijkt buitenspel te zijn gezet ten gunste van dringender problemen.

Deze stap onderstreept het toenemende toezicht op de veiligheid van AI en de ethische dilemma’s waarmee ontwikkelaars worden geconfronteerd als ze de grenzen van de mogelijkheden van chatbots verleggen. Het incident benadrukt de moeilijke afwegingen tussen innovatie en verantwoorde inzet, vooral als het gaat om potentieel schadelijke inhoud.