Hub d'art, de mode et de divertissement de Decrypt.
Découvrez SCENE
Anthropic a lancé Claude Opus 4.5 lundi, complétant sa famille de trois modèles et marquant le troisième lancement majeur de l'entreprise en seulement deux mois. Le nouveau modèle phare revendique la première place dans les benchmarks de codage tout en réduisant les prix de manière spectaculaire.
La sortie couronne un déploiement rapide qui a commencé avec Claude Sonnet 4.5 fin septembre et s'est poursuivi avec Claude Haiku 4.5 en octobre. Maintenant qu'Opus rejoint ses frères et sœurs, Anthropic offre aux développeurs un ensemble d'outils complet : Opus pour un travail de production complexe, Sonnet pour des tâches quotidiennes et Haiku pour des tâches liées à la rapidité et à l'efficacité qui nécessitent une logique simple.
Claude Opus 4.5 a obtenu un score de 80,9 % sur SWE-bench Verified, un benchmark testant des tâches d'ingénierie logicielle dans le monde réel. Cela devance le GPT-5.1-Codex-Max d'OpenAI à 77,9 % et le Gemini 3 Pro de Google à 76,2 %. Anthropic affirme qu'Opus a surpassé tous les candidats humains lors de son examen interne d'ingénierie de performance—une évaluation de deux heures conçue pour évaluer le jugement sous pression.
Il y a eu une course entre les géants de l'IA pour finir l'année en tête des classements. Google a lancé Gemini 3 Pro le 18 novembre, le positionnant comme une avancée dans le raisonnement multimodal. OpenAI a riposté le lendemain avec GPT-5.1-Codex-Max.
Présentation de Claude Opus 4.5 : le meilleur modèle au monde pour le codage, les agents et l'utilisation des ordinateurs.
Opus 4.5 est un pas en avant dans ce que les systèmes d'IA peuvent faire, et un aperçu de changements plus importants sur la façon dont le travail est effectué. pic.twitter.com/mid2Z1qzIf
— Claude (@claudeai) 24 novembre 2025
<br>
La réponse d'Anthropic avec Opus est arrivée seulement quelques jours plus tard, mais elle est arrivée avec un attrait : un prix de $5 par million de jetons d'entrée et $25 par million de jetons de sortie, ce qui représente une réduction de 67 % par rapport au modèle Opus précédent.
Les modèles Qwen d'Alibaba ajoutent une nouvelle dimension à la course. L'entreprise a lancé Qwen2.5-Max fin janvier avec plus de 20 billions de tokens d'entraînement, affirmant qu'il surpasse DeepSeek-V3 sur des benchmarks clés. Qwen3-Max, lancé en septembre avec plus de 1 billion de paramètres, se classe troisième au niveau mondial sur LMArena et excelle dans différentes tâches telles que la recherche approfondie, le raisonnement multimodal ou les flux de travail dans les langues orientales. Bien que les modèles Qwen restent relativement obscurs sur les marchés occidentaux, ils représentent la volonté de la Chine d'atteindre l'autonomie en matière d'IA face aux restrictions d'exportation de puces américaines.
Ce prix se situe entre le dernier GPT-5.1 d'OpenAI ($1.25/$10) et l'Opus 4.1 plus ancien d'Anthropic ($15/$75), bien qu'il soit toujours plus cher que le Gemini 3 Pro à $2/$12. La réduction signale une pression sur le marché alors que les principaux laboratoires d'IA ne se battent pas seulement sur les capacités, mais aussi pour rendre l'intelligence de pointe économiquement viable pour un déploiement à grande échelle.
La dernière offre de Claude est toujours plus chère que celle de nombreux concurrents asiatiques, mais elle est également un peu plus performante. Les utilisateurs ont donc désormais la possibilité de choisir entre l'efficacité économique ou la pure capacité technique.
Le Sonnet 4.5, sorti le 30 septembre, a apporté une technologie de codage de pointe et des capacités d'agent à un coût modéré et était déjà meilleur que l'Opus 4.1 dans des tâches spécifiques. Le plus simple Haiku 4.5 a été dévoilé le 15 octobre. L'Opus 4.5 se trouve maintenant au sommet, gérant les raisonnements les plus difficiles et les tâches les plus longues.
Tout comme Sonnet et GPT-5, Claude Opus 4.5 utilise ce qu'Anthropic appelle une architecture de “raisonnement hybride”—un seul modèle entraîné à la fois pour l'inférence directe et le traitement en chaîne de pensée. Il prend en charge une fenêtre de contexte de 200 000 tokens et peut produire jusqu'à 64 000 tokens. La date limite de connaissances du modèle est mars 2025, légèrement en avance par rapport à la date de janvier de Sonnet.
Le développeur Simon Willison a testé Opus 4.5 de manière exhaustive pendant le week-end, l'utilisant pour refactoriser l'un de ses projets. Le modèle a géré 20 commits à travers 39 fichiers, ajoutant 2 022 lignes et en supprimant 1 173 autres. “C'est clairement un excellent nouveau modèle,” a écrit Willison, bien qu'il ait noté que revenir à Sonnet 4.5 par la suite n'a pas réduit de manière dramatique sa productivité.
“Je ne dis pas que le nouveau modèle n'est pas une amélioration par rapport au Sonnet 4.5—mais je ne peux pas affirmer avec confiance que les défis que j'ai posés [à] lui ont pu identifier une différence significative dans les capacités entre les deux,” a-t-il écrit.
Theo Browne, un développeur, YouTuber et PDG de la plateforme d'IA T3 Chat, a qualifié Claude Opus 4.5 d'“insensé”, ajoutant dans une critique vidéo que c'est “sans aucun doute le meilleur modèle de codage jamais créé.”
Le paysage concurrentiel est devenu de plus en plus encombré. Le Gemini 3 Pro de Google a dominé les gros titres la semaine dernière, obtenant un score de 1501 sur LMArena et récoltant les éloges du PDG de Salesforce, Marc Benioff, qui a déclaré qu'il abandonnait ChatGPT pour le modèle de Google. Cette annonce a fait grimper l'action d'Alphabet de plus de 6 % et aurait apparemment ébranlé le PDG d'OpenAI, Sam Altman, qui a dit à ses collègues que Gemini créerait “des vents contraires économiques temporaires.”
Microsoft et Nvidia ont annoncé des investissements de plusieurs milliards de dollars dans Anthropic la semaine dernière, portant la valorisation de la startup à environ $350 milliards. Les accords incluent une intégration Azure élargie et une infrastructure alimentée par Nvidia pour l'entraînement et le déploiement des modèles Claude.
Opus 4.5 est disponible immédiatement via l'API d'Anthropic, AWS Bedrock, Google Vertex AI, et les applications web et de bureau Claude.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Anthropic complète les mises à jour de son modèle d'IA avec Claude Opus 4.5—et réduit les prix.
Hub d'art, de mode et de divertissement de Decrypt.
Découvrez SCENE
Anthropic a lancé Claude Opus 4.5 lundi, complétant sa famille de trois modèles et marquant le troisième lancement majeur de l'entreprise en seulement deux mois. Le nouveau modèle phare revendique la première place dans les benchmarks de codage tout en réduisant les prix de manière spectaculaire.
La sortie couronne un déploiement rapide qui a commencé avec Claude Sonnet 4.5 fin septembre et s'est poursuivi avec Claude Haiku 4.5 en octobre. Maintenant qu'Opus rejoint ses frères et sœurs, Anthropic offre aux développeurs un ensemble d'outils complet : Opus pour un travail de production complexe, Sonnet pour des tâches quotidiennes et Haiku pour des tâches liées à la rapidité et à l'efficacité qui nécessitent une logique simple.
Claude Opus 4.5 a obtenu un score de 80,9 % sur SWE-bench Verified, un benchmark testant des tâches d'ingénierie logicielle dans le monde réel. Cela devance le GPT-5.1-Codex-Max d'OpenAI à 77,9 % et le Gemini 3 Pro de Google à 76,2 %. Anthropic affirme qu'Opus a surpassé tous les candidats humains lors de son examen interne d'ingénierie de performance—une évaluation de deux heures conçue pour évaluer le jugement sous pression.
Il y a eu une course entre les géants de l'IA pour finir l'année en tête des classements. Google a lancé Gemini 3 Pro le 18 novembre, le positionnant comme une avancée dans le raisonnement multimodal. OpenAI a riposté le lendemain avec GPT-5.1-Codex-Max.
<br>
La réponse d'Anthropic avec Opus est arrivée seulement quelques jours plus tard, mais elle est arrivée avec un attrait : un prix de $5 par million de jetons d'entrée et $25 par million de jetons de sortie, ce qui représente une réduction de 67 % par rapport au modèle Opus précédent.
Les modèles Qwen d'Alibaba ajoutent une nouvelle dimension à la course. L'entreprise a lancé Qwen2.5-Max fin janvier avec plus de 20 billions de tokens d'entraînement, affirmant qu'il surpasse DeepSeek-V3 sur des benchmarks clés. Qwen3-Max, lancé en septembre avec plus de 1 billion de paramètres, se classe troisième au niveau mondial sur LMArena et excelle dans différentes tâches telles que la recherche approfondie, le raisonnement multimodal ou les flux de travail dans les langues orientales. Bien que les modèles Qwen restent relativement obscurs sur les marchés occidentaux, ils représentent la volonté de la Chine d'atteindre l'autonomie en matière d'IA face aux restrictions d'exportation de puces américaines.
Ce prix se situe entre le dernier GPT-5.1 d'OpenAI ($1.25/$10) et l'Opus 4.1 plus ancien d'Anthropic ($15/$75), bien qu'il soit toujours plus cher que le Gemini 3 Pro à $2/$12. La réduction signale une pression sur le marché alors que les principaux laboratoires d'IA ne se battent pas seulement sur les capacités, mais aussi pour rendre l'intelligence de pointe économiquement viable pour un déploiement à grande échelle.
La dernière offre de Claude est toujours plus chère que celle de nombreux concurrents asiatiques, mais elle est également un peu plus performante. Les utilisateurs ont donc désormais la possibilité de choisir entre l'efficacité économique ou la pure capacité technique.
Le Sonnet 4.5, sorti le 30 septembre, a apporté une technologie de codage de pointe et des capacités d'agent à un coût modéré et était déjà meilleur que l'Opus 4.1 dans des tâches spécifiques. Le plus simple Haiku 4.5 a été dévoilé le 15 octobre. L'Opus 4.5 se trouve maintenant au sommet, gérant les raisonnements les plus difficiles et les tâches les plus longues.
Tout comme Sonnet et GPT-5, Claude Opus 4.5 utilise ce qu'Anthropic appelle une architecture de “raisonnement hybride”—un seul modèle entraîné à la fois pour l'inférence directe et le traitement en chaîne de pensée. Il prend en charge une fenêtre de contexte de 200 000 tokens et peut produire jusqu'à 64 000 tokens. La date limite de connaissances du modèle est mars 2025, légèrement en avance par rapport à la date de janvier de Sonnet.
Le développeur Simon Willison a testé Opus 4.5 de manière exhaustive pendant le week-end, l'utilisant pour refactoriser l'un de ses projets. Le modèle a géré 20 commits à travers 39 fichiers, ajoutant 2 022 lignes et en supprimant 1 173 autres. “C'est clairement un excellent nouveau modèle,” a écrit Willison, bien qu'il ait noté que revenir à Sonnet 4.5 par la suite n'a pas réduit de manière dramatique sa productivité.
“Je ne dis pas que le nouveau modèle n'est pas une amélioration par rapport au Sonnet 4.5—mais je ne peux pas affirmer avec confiance que les défis que j'ai posés [à] lui ont pu identifier une différence significative dans les capacités entre les deux,” a-t-il écrit.
Theo Browne, un développeur, YouTuber et PDG de la plateforme d'IA T3 Chat, a qualifié Claude Opus 4.5 d'“insensé”, ajoutant dans une critique vidéo que c'est “sans aucun doute le meilleur modèle de codage jamais créé.”
Le paysage concurrentiel est devenu de plus en plus encombré. Le Gemini 3 Pro de Google a dominé les gros titres la semaine dernière, obtenant un score de 1501 sur LMArena et récoltant les éloges du PDG de Salesforce, Marc Benioff, qui a déclaré qu'il abandonnait ChatGPT pour le modèle de Google. Cette annonce a fait grimper l'action d'Alphabet de plus de 6 % et aurait apparemment ébranlé le PDG d'OpenAI, Sam Altman, qui a dit à ses collègues que Gemini créerait “des vents contraires économiques temporaires.”
Microsoft et Nvidia ont annoncé des investissements de plusieurs milliards de dollars dans Anthropic la semaine dernière, portant la valorisation de la startup à environ $350 milliards. Les accords incluent une intégration Azure élargie et une infrastructure alimentée par Nvidia pour l'entraînement et le déploiement des modèles Claude.
Opus 4.5 est disponible immédiatement via l'API d'Anthropic, AWS Bedrock, Google Vertex AI, et les applications web et de bureau Claude.