Un gruppo di importanti creatori di contenuti ha lanciato un’azione legale contro Amazon, sostenendo che il colosso della tecnologia ha utilizzato contenuti video non autorizzati per addestrare i suoi modelli di intelligenza artificiale generativa. La causa, intentata presso un tribunale federale di Seattle, segna una significativa escalation nella battaglia in corso tra proprietari di proprietà intellettuale e sviluppatori di intelligenza artificiale.
Le accuse principali: raschiamento ed elusione dei dati
I querelanti, che includono singoli YouTuber e aziende come Ted Entertainment (l’entità dietro H3 Podcast e h3h3 Productions ), affermano che Amazon ha implementato strumenti automatizzati per “estrarre” milioni di video da YouTube.
Secondo la denuncia, questi dati sono stati raccolti per sviluppare e perfezionare Nova Reel, il sistema di intelligenza artificiale generativa di Amazon in grado di produrre brevi videoclip da messaggi di testo e immagini. La causa evidenzia diversi metodi sofisticati presumibilmente utilizzati da Amazon per ottenere questi dati:
- Utilizzo di macchine virtuali: per imitare il comportamento umano ed evitare il rilevamento.
- Indirizzi IP a rotazione: per aggirare i protocolli di sicurezza di YouTube e le misure di salvaguardia contro il download collettivo.
- Elusione delle protezioni: aggirare efficacemente le barriere tecniche della piattaforma progettate per impedire l’estrazione di dati di massa.
I creatori sostengono che queste azioni costituiscono una violazione sia della legge sul copyright che del Digital Millennium Copyright Act (DMCA). Chiedono danni finanziari e un’ingiunzione del tribunale per fermare immediatamente queste pratiche.
Perché è importante: il passaggio dal testo al video
Sebbene il panorama legale dell’intelligenza artificiale si sia concentrato fortemente sui contenuti scritti, come libri, articoli di notizie e codici, questa causa segnala una nuova frontiera: l’era della formazione sull’intelligenza artificiale basata su video.
Per diversi anni, il dibattito centrale nel diritto dell’IA è stato se i modelli di formazione su testi protetti da copyright si qualificano come “fair use”. Tuttavia, man mano che modelli di video generativi come Sora di OpenAI, Veo di Google e Nova Reel di Amazon diventano più sofisticati, la posta in gioco per i creatori è cambiata.
Il contenuto video è molto più complesso del testo. Si tratta non solo di dati visivi, ma anche di:
1. Prestazioni e personalità: il modo unico in cui un creatore si presenta.
2. Audio e voce: la cadenza e il tono specifici del discorso di un creator.
3. Editing creativo: le scelte stilistiche specifiche che definiscono il brand di un canale.
Se i tribunali stabilissero che lo scraping di contenuti video per la formazione sull’intelligenza artificiale è consentito, ciò potrebbe alterare radicalmente l’economia dell’economia dei creatori, svalutando potenzialmente il contenuto stesso che rende funzionali questi modelli di intelligenza artificiale.
Guardando al futuro
Amazon non ha ancora risposto alle richieste di commento riguardo al contenzioso. Mentre il caso si sposta attraverso il sistema giudiziario federale, servirà probabilmente come test fondamentale per quanto controllo mantengono i creatori sulla loro immagine digitale e sulla produzione creativa in un mondo sempre più automatizzato.
Questa battaglia legale creerà probabilmente un precedente fondamentale per stabilire se la dottrina del “fair use” si estende alla raccolta su vasta scala di media visivi e uditivi utilizzati per alimentare la prossima generazione di IA generativa.
