A Anthropic lançou o Claude Opus 4.5 na segunda-feira, completando a sua família de três modelos e marcando o terceiro grande lançamento da empresa em apenas dois meses. O novo modelo principal reivindica o primeiro lugar nos benchmarks de codificação enquanto reduz os preços drasticamente.
O lançamento culmina uma rápida implementação que começou com o Claude Sonnet 4.5 no final de setembro e continuou com o Claude Haiku 4.5 em outubro. Agora, com o Opus juntando-se aos seus irmãos, a Anthropic oferece aos desenvolvedores um conjunto completo de ferramentas: Opus para trabalhos de produção complexos, Sonnet para tarefas do dia-a-dia, e Haiku para tarefas relacionadas à velocidade e eficiência que exigem lógica simples.
Claude Opus 4.5 obteve 80,9% no SWE-bench Verified, um benchmark que testa tarefas de engenharia de software do mundo real. Isso supera o GPT-5.1-Codex-Max da OpenAI com 77,9% e o Gemini 3 Pro da Google com 76,2%. A Anthropic afirma que o Opus superou todos os candidatos humanos no seu exame interno de engenharia de desempenho - uma avaliação de duas horas projetada para avaliar o julgamento sob pressão.
Tem havido uma corrida entre os gigantes da IA para terminar o ano no topo das tabelas de classificação. O Google lançou o Gemini 3 Pro a 18 de novembro, posicionando-o como uma inovação no raciocínio multimodal. A OpenAI respondeu no dia seguinte com o GPT-5.1-Codex-Max.
Apresentando Claude Opus 4.5: o melhor modelo do mundo para codificação, agentes e uso de computador.
Opus 4.5 é um avanço no que os sistemas de IA podem fazer, e uma prévia de mudanças maiores sobre como o trabalho é realizado. pic.twitter.com/mid2Z1qzIf
— Claude (@claudeai) 24 de novembro de 2025
<br>
A resposta da Anthropic com o Opus chegou apenas alguns dias depois, mas veio com uma isca: preço de $5 por milhão de tokens de entrada e $25 por milhão de tokens de saída, o que representa uma redução de 67% em relação ao modelo anterior do Opus.
Os modelos Qwen da Alibaba adicionam outra dimensão à corrida. A empresa lançou o Qwen2.5-Max no final de janeiro com mais de 20 trilhões de tokens de treinamento, afirmando que supera o DeepSeek-V3 em benchmarks-chave. O Qwen3-Max, lançado em setembro com mais de 1 trilhão de parâmetros, ocupa o terceiro lugar globalmente no LMArena e se destaca em diferentes tarefas como pesquisa profunda, raciocínio multimodal ou fluxos de trabalho em línguas orientais. Embora os modelos Qwen permaneçam relativamente obscuros nos mercados ocidentais, eles representam o impulso da China por autossuficiência em IA em meio a restrições de exportação de chips dos EUA.
Esse preço fica entre o mais recente GPT-5.1 da OpenAI ($1.25/$10) e o mais antigo Opus 4.1 da Anthropic ($15/$75), embora ainda seja mais caro que o Gemini 3 Pro, que custa $2/$12. A redução sinaliza pressão de mercado à medida que os principais laboratórios de IA competem não apenas em capacidade, mas também em tornar a inteligência de fronteira economicamente viável para implantação em larga escala.
A mais recente oferta de Claude ainda é mais cara do que muitos concorrentes asiáticos, mas também é um pouco mais capaz. Portanto, os usuários agora têm a capacidade de escolher entre eficiência de custo ou pura capacidade técnica.
Soneto 4.5, lançado a 30 de setembro, trouxe codificação e capacidades de agente de última geração a um custo moderado e já era melhor que o Opus 4.1 em tarefas específicas. O mais simples Haiku 4.5 foi revelado a 15 de outubro. O Opus 4.5 agora ocupa o topo, lidando com o raciocínio mais difícil e as tarefas de mais longa duração.
Semelhante ao Sonnet e ao GPT-5, Claude Opus 4.5 utiliza o que a Anthropic chama de uma arquitetura de “raciocínio híbrido”—um único modelo treinado tanto para inferência direta quanto para processamento de cadeia de pensamento. Ele suporta uma janela de contexto de 200.000 tokens e pode gerar até 64.000 tokens. O limite de conhecimento do modelo é março de 2025, ligeiramente à frente da data de janeiro do Sonnet.
O desenvolvedor Simon Willison testou o Opus 4.5 extensivamente durante o fim de semana, utilizando-o para refatorar um de seus projetos. O modelo lidou com 20 commits em 39 arquivos, adicionando 2.022 linhas e removendo 1.173 outras. “É claramente um excelente novo modelo,” escreveu Willison, embora tenha observado que retornar ao Sonnet 4.5 posteriormente não reduziu dramaticamente sua produtividade.
“Não estou a dizer que o novo modelo não é uma melhoria em relação ao Sonnet 4.5—mas não posso afirmar com confiança que os desafios que lhe propus [a] foram capazes de identificar uma diferença significativa nas capacidades entre os dois,” escreveu ele.
Theo Browne, um desenvolvedor, YouTuber e CEO da plataforma de IA T3 Chat, chamou Claude Opus 4.5 de “insano,” acrescentando em uma análise em vídeo que é “definitivamente o melhor modelo de codificação já feito.”
O cenário competitivo tornou-se cada vez mais saturado. O Gemini 3 Pro do Google dominou as manchetes na semana passada, marcando 1501 no LMArena e recebendo elogios do CEO da Salesforce, Marc Benioff, que disse que está abandonando o ChatGPT pelo modelo do Google. Esse anúncio fez com que as ações da Alphabet subissem mais de 6% e, segundo relatos, deixou o CEO da OpenAI, Sam Altman, inquieto, que disse a colegas que o Gemini criaria “ventos econômicos temporários.”
A Microsoft e a Nvidia anunciaram investimentos de vários bilhões de dólares na Anthropic na semana passada, aumentando a avaliação da startup para aproximadamente $350 bilhões. Os acordos incluem uma integração ampliada com o Azure e infraestrutura alimentada pela Nvidia para treinar e implantar modelos Claude.
Opus 4.5 está disponível imediatamente através da API da Anthropic, AWS Bedrock, Google Vertex AI e dos aplicativos web e desktop do Claude.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Anthropic Completa Atualizações do Modelo de IA com Claude Opus 4.5—E Reduz Preços
Hub de Arte, Moda e Entretenimento da Decrypt.
Descubra SCENE
A Anthropic lançou o Claude Opus 4.5 na segunda-feira, completando a sua família de três modelos e marcando o terceiro grande lançamento da empresa em apenas dois meses. O novo modelo principal reivindica o primeiro lugar nos benchmarks de codificação enquanto reduz os preços drasticamente.
O lançamento culmina uma rápida implementação que começou com o Claude Sonnet 4.5 no final de setembro e continuou com o Claude Haiku 4.5 em outubro. Agora, com o Opus juntando-se aos seus irmãos, a Anthropic oferece aos desenvolvedores um conjunto completo de ferramentas: Opus para trabalhos de produção complexos, Sonnet para tarefas do dia-a-dia, e Haiku para tarefas relacionadas à velocidade e eficiência que exigem lógica simples.
Claude Opus 4.5 obteve 80,9% no SWE-bench Verified, um benchmark que testa tarefas de engenharia de software do mundo real. Isso supera o GPT-5.1-Codex-Max da OpenAI com 77,9% e o Gemini 3 Pro da Google com 76,2%. A Anthropic afirma que o Opus superou todos os candidatos humanos no seu exame interno de engenharia de desempenho - uma avaliação de duas horas projetada para avaliar o julgamento sob pressão.
Tem havido uma corrida entre os gigantes da IA para terminar o ano no topo das tabelas de classificação. O Google lançou o Gemini 3 Pro a 18 de novembro, posicionando-o como uma inovação no raciocínio multimodal. A OpenAI respondeu no dia seguinte com o GPT-5.1-Codex-Max.
<br>
A resposta da Anthropic com o Opus chegou apenas alguns dias depois, mas veio com uma isca: preço de $5 por milhão de tokens de entrada e $25 por milhão de tokens de saída, o que representa uma redução de 67% em relação ao modelo anterior do Opus.
Os modelos Qwen da Alibaba adicionam outra dimensão à corrida. A empresa lançou o Qwen2.5-Max no final de janeiro com mais de 20 trilhões de tokens de treinamento, afirmando que supera o DeepSeek-V3 em benchmarks-chave. O Qwen3-Max, lançado em setembro com mais de 1 trilhão de parâmetros, ocupa o terceiro lugar globalmente no LMArena e se destaca em diferentes tarefas como pesquisa profunda, raciocínio multimodal ou fluxos de trabalho em línguas orientais. Embora os modelos Qwen permaneçam relativamente obscuros nos mercados ocidentais, eles representam o impulso da China por autossuficiência em IA em meio a restrições de exportação de chips dos EUA.
Esse preço fica entre o mais recente GPT-5.1 da OpenAI ($1.25/$10) e o mais antigo Opus 4.1 da Anthropic ($15/$75), embora ainda seja mais caro que o Gemini 3 Pro, que custa $2/$12. A redução sinaliza pressão de mercado à medida que os principais laboratórios de IA competem não apenas em capacidade, mas também em tornar a inteligência de fronteira economicamente viável para implantação em larga escala.
A mais recente oferta de Claude ainda é mais cara do que muitos concorrentes asiáticos, mas também é um pouco mais capaz. Portanto, os usuários agora têm a capacidade de escolher entre eficiência de custo ou pura capacidade técnica.
Soneto 4.5, lançado a 30 de setembro, trouxe codificação e capacidades de agente de última geração a um custo moderado e já era melhor que o Opus 4.1 em tarefas específicas. O mais simples Haiku 4.5 foi revelado a 15 de outubro. O Opus 4.5 agora ocupa o topo, lidando com o raciocínio mais difícil e as tarefas de mais longa duração.
Semelhante ao Sonnet e ao GPT-5, Claude Opus 4.5 utiliza o que a Anthropic chama de uma arquitetura de “raciocínio híbrido”—um único modelo treinado tanto para inferência direta quanto para processamento de cadeia de pensamento. Ele suporta uma janela de contexto de 200.000 tokens e pode gerar até 64.000 tokens. O limite de conhecimento do modelo é março de 2025, ligeiramente à frente da data de janeiro do Sonnet.
O desenvolvedor Simon Willison testou o Opus 4.5 extensivamente durante o fim de semana, utilizando-o para refatorar um de seus projetos. O modelo lidou com 20 commits em 39 arquivos, adicionando 2.022 linhas e removendo 1.173 outras. “É claramente um excelente novo modelo,” escreveu Willison, embora tenha observado que retornar ao Sonnet 4.5 posteriormente não reduziu dramaticamente sua produtividade.
“Não estou a dizer que o novo modelo não é uma melhoria em relação ao Sonnet 4.5—mas não posso afirmar com confiança que os desafios que lhe propus [a] foram capazes de identificar uma diferença significativa nas capacidades entre os dois,” escreveu ele.
Theo Browne, um desenvolvedor, YouTuber e CEO da plataforma de IA T3 Chat, chamou Claude Opus 4.5 de “insano,” acrescentando em uma análise em vídeo que é “definitivamente o melhor modelo de codificação já feito.”
O cenário competitivo tornou-se cada vez mais saturado. O Gemini 3 Pro do Google dominou as manchetes na semana passada, marcando 1501 no LMArena e recebendo elogios do CEO da Salesforce, Marc Benioff, que disse que está abandonando o ChatGPT pelo modelo do Google. Esse anúncio fez com que as ações da Alphabet subissem mais de 6% e, segundo relatos, deixou o CEO da OpenAI, Sam Altman, inquieto, que disse a colegas que o Gemini criaria “ventos econômicos temporários.”
A Microsoft e a Nvidia anunciaram investimentos de vários bilhões de dólares na Anthropic na semana passada, aumentando a avaliação da startup para aproximadamente $350 bilhões. Os acordos incluem uma integração ampliada com o Azure e infraestrutura alimentada pela Nvidia para treinar e implantar modelos Claude.
Opus 4.5 está disponível imediatamente através da API da Anthropic, AWS Bedrock, Google Vertex AI e dos aplicativos web e desktop do Claude.