Anthropic ha lanciato il suo ultimo modello di intelligenza artificiale, Claude Opus 4.5, riducendo significativamente i prezzi della concorrenza e dimostrando capacità all’avanguardia, in particolare nell’ingegneria del software. Questa versione intensifica la concorrenza con OpenAI e Google, segnalando una rapida evoluzione nelle prestazioni e nell’accessibilità dell’IA. La mossa è strategicamente pianificata poiché anche i rivali lanciano modelli avanzati, spingendo l’intero settore in avanti a un ritmo senza precedenti.

L’intelligenza artificiale supera gli esseri umani nei principali test di ingegneria

Il nuovo modello ha superato le prestazioni umane secondo le più rigorose valutazioni ingegneristiche interne di Anthropic. In effetti, Opus 4.5 ha ottenuto un punteggio più alto di qualsiasi altro candidato nella storia dell’azienda, evidenziando la capacità sempre più rapida dell’intelligenza artificiale di affrontare compiti complessi da colletto bianco. Questo non è semplicemente un miglioramento marginale; solleva domande cruciali sul futuro delle professioni tradizionalmente svolte da esperti umani.

Drastici tagli ai prezzi espandono l’accesso all’IA

Anthropic ha tagliato i prezzi di circa due terzi. Opus 4.5 costa 5 dollari per milione di token di input e 25 dollari per milione di token di output, rispetto ai 15 e 75 dollari del modello precedente. Questa riduzione rende l’intelligenza artificiale avanzata accessibile a una gamma più ampia di sviluppatori e aziende, costringendo i concorrenti a rispondere con adeguamenti dei prezzi simili. L’obiettivo, secondo il responsabile delle relazioni con gli sviluppatori di Anthropic, Alex Albert, è “consentire a Claude di essere migliore nell’aiutarti a fare le cose che non vuoi necessariamente fare nel tuo lavoro”.

Benchmark delle prestazioni: Opus 4.5 è in testa al campo

Test indipendenti mostrano che Opus 4.5 supera il GPT-5.1-Codex-Max di OpenAI e il Gemini 3 Pro di Google nel benchmark SWE-bench Verified, una misura chiave delle attività di ingegneria del software nel mondo reale. Il modello ha raggiunto una precisione dell’80,9%, superando i concorrenti di diversi punti percentuali. Ma al di là dei numeri grezzi, gli sviluppatori riferiscono che Opus 4.5 dimostra un miglioramento della capacità di giudizio e di intuizione in diverse situazioni. Il modello ora “capisce e basta”, secondo Albert, esibendo un salto di qualità nelle capacità di ragionamento.

Agenti IA e auto-miglioramento: un nuovo livello di automazione

I primi utenti utilizzano Opus 4.5 per creare “agenti che si auto-migliorano”, sistemi di intelligenza artificiale che perfezionano le proprie prestazioni attraverso l’apprendimento iterativo. Rakuten, ad esempio, ha scoperto che i suoi agenti IA raggiungevano le massime prestazioni in sole quattro iterazioni, mentre altri modelli faticavano a eguagliare quella qualità anche dopo dieci tentativi. Questa funzionalità si estende oltre la codifica, con miglioramenti significativi segnalati nella creazione di documenti professionali, nell’analisi dei fogli di calcolo e nella progettazione delle presentazioni.

Le nuove funzionalità migliorano la produttività e l’efficienza

Anthropic ha inoltre introdotto diversi aggiornamenti di prodotto:

  • Chat infinite: Elimina le limitazioni della finestra di contesto riepilogando automaticamente le conversazioni lunghe.
  • Claude per Excel: Supporta tabelle pivot, grafici e caricamenti di file per l’analisi avanzata dei dati.
  • Chiamata di strumenti di programmazione: Consente a Claude di eseguire codice e invocare direttamente funzioni.
  • Estensione Chrome: Ora disponibile per tutti gli utenti Max per un’integrazione perfetta con i flussi di lavoro del browser.

Questi miglioramenti sono progettati per massimizzare l’efficienza e la produttività per gli utenti aziendali.

Dinamiche di mercato e implicazioni future

Le entrate di Anthropic sono raddoppiate nel primo trimestre del 2025, raggiungendo i 2 miliardi di dollari all’anno. Il numero di clienti ad alta spesa è aumentato di otto volte anno su anno, indicando una crescente domanda per i suoi servizi di intelligenza artificiale. Tuttavia, la redditività rimane una sfida poiché i laboratori di intelligenza artificiale continuano a investire massicciamente in infrastrutture e talenti.

Il panorama competitivo si sta surriscaldando, con OpenAI e Google che rilasciano i propri modelli avanzati a un ritmo rapido. La corsa per sviluppare l’intelligenza artificiale più capace sta guidando l’innovazione ma solleva anche preoccupazioni circa il potenziale impatto sul lavoro professionale. Man mano che le prestazioni dell’intelligenza artificiale nei compiti tecnici si avvicinano, e talvolta superano, i livelli degli esperti umani, l’influenza della tecnologia sul mercato del lavoro diventa sempre più reale.

“Penso che sia un segnale davvero importante a cui prestare attenzione”, afferma Alex Albert di Anthropic, sottolineando l’importanza di questi sviluppi.

Il rapido progresso dell’intelligenza artificiale non è più una possibilità lontana ma una realtà presente, che rimodella le industrie e costringe sia le imprese che i lavoratori ad adattarsi.