Anthropic a lancé son dernier modèle d’IA, Claude Opus 4.5, réduisant considérablement les prix des concurrents tout en démontrant des capacités de pointe, notamment en matière d’ingénierie logicielle. Cette version intensifie la concurrence avec OpenAI et Google, signalant une évolution rapide des performances et de l’accessibilité de l’IA. Cette décision arrive à un moment stratégique, car les concurrents déploient également des modèles avancés, faisant ainsi progresser l’ensemble du secteur à un rythme sans précédent.
L’IA surpasse les humains dans les tests d’ingénierie clés
Le nouveau modèle a surpassé les performances humaines lors des évaluations d’ingénierie internes les plus rigoureuses d’Anthropic. En fait, l’Opus 4.5 a obtenu un score plus élevé que n’importe quel candidat dans l’histoire de l’entreprise, soulignant la capacité accélérée de l’IA à s’attaquer à des tâches complexes en col blanc. Il ne s’agit pas simplement d’une amélioration marginale ; cela soulève des questions cruciales sur l’avenir des professions traditionnellement exercées par des experts humains.
Des baisses de prix spectaculaires élargissent l’accès à l’IA
Anthropic a réduit ses prix d’environ deux tiers. L’Opus 4.5 coûte 5 $ par million de jetons d’entrée et 25 $ par million de jetons de sortie, contre 15 $ et 75 $ pour le modèle précédent. Cette réduction rend l’IA avancée accessible à un plus large éventail de développeurs et d’entreprises, obligeant les concurrents à réagir avec des ajustements de prix similaires. L’objectif, selon Alex Albert, responsable des relations avec les développeurs d’Anthropic, est de “permettre à Claude de mieux vous aider à faire les choses que vous ne voulez pas nécessairement faire dans votre travail”.
Benchmarks de performances : Opus 4.5 en tête du peloton
Des tests indépendants montrent que l’Opus 4.5 surpasse le GPT-5.1-Codex-Max d’OpenAI et le Gemini 3 Pro de Google sur le benchmark SWE-bench Verified, une mesure clé des tâches d’ingénierie logicielle du monde réel. Le modèle a atteint une précision de 80,9 %, dépassant ses concurrents de plusieurs points de pourcentage. Mais au-delà des chiffres bruts, les développeurs rapportent que l’Opus 4.5 fait preuve d’un jugement et d’une intuition améliorés dans diverses situations. Le modèle « comprend désormais tout simplement », selon Albert, démontrant un saut qualitatif dans les capacités de raisonnement.
Agents IA et auto-amélioration : un nouveau niveau d’automatisation
Les premiers utilisateurs utilisent Opus 4.5 pour créer des « agents auto-améliorés » : des systèmes d’IA qui affinent leurs propres performances grâce à un apprentissage itératif. Rakuten, par exemple, a constaté que ses agents d’IA atteignaient des performances optimales en seulement quatre itérations, alors que d’autres modèles avaient du mal à atteindre cette qualité même après dix tentatives. Cette capacité s’étend au-delà du codage, avec des améliorations significatives signalées dans la création de documents professionnels, l’analyse de feuilles de calcul et la conception de présentations.
De nouvelles fonctionnalités améliorent la productivité et l’efficacité
Anthropic a également introduit plusieurs mises à jour de produits :
- Infinite Chats : Élimine les limitations de la fenêtre contextuelle en résumant automatiquement les longues conversations.
- Claude pour Excel : Prend en charge les tableaux croisés dynamiques, les graphiques et les téléchargements de fichiers pour une analyse avancée des données.
- Appel d’outil de programmation : Permet à Claude d’exécuter du code et d’invoquer directement des fonctions.
- Extension Chrome : Désormais disponible pour tous les utilisateurs Max pour une intégration transparente avec les flux de travail du navigateur.
Ces améliorations sont conçues pour maximiser l’efficacité et la productivité des utilisateurs d’entreprise.
Dynamique du marché et implications futures
Les revenus d’Anthropic ont doublé au premier trimestre 2025, pour atteindre 2 milliards de dollars par an. Le nombre de clients dépensiers a été multiplié par huit d’une année sur l’autre, ce qui indique une demande croissante pour ses services d’IA. Cependant, la rentabilité reste un défi alors que les laboratoires d’IA continuent d’investir massivement dans les infrastructures et les talents.
Le paysage concurrentiel s’intensifie, OpenAI et Google lançant rapidement leurs propres modèles avancés. La course au développement de l’IA la plus performante stimule l’innovation mais suscite également des inquiétudes quant à son impact potentiel sur le travail professionnel. À mesure que les performances de l’IA sur les tâches techniques se rapprochent – et parfois dépassent – des niveaux d’experts humains, l’influence de la technologie sur le marché du travail devient de plus en plus réelle.
“Je pense que c’est un signal très important auquel il faut prêter attention”, déclare Alex Albert d’Anthropic, soulignant l’importance de ces développements.
Les progrès rapides de l’IA ne sont plus une possibilité lointaine mais une réalité actuelle, qui remodèle les industries et oblige les entreprises et les travailleurs à s’adapter.
