Anthropic Identifica Três Alterações na Camada de Produto por Detrás da Queda da Qualidade do Claude Code, e Não um Problema do Modelo

Mensagem do Gate News, 23 de abril — A equipa de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code reportada pelos utilizadores ao longo do último mês resultou de três alterações independentes na camada de produto, e não de problemas na API ou no modelo subjacente. Os três problemas foram corrigidos a 7 de abril, 10 de abril e 20 de abril, respetivamente, com a versão final agora na v2.1.116.

A primeira alteração ocorreu a 4 de março, quando a equipa reduziu o nível de esforço de raciocínio predefinido do Claude Code de “high” para “medium” para abordar picos ocasionais e extremos de latência no Opus 4.6 sob elevada intensidade de raciocínio. Após reclamações generalizadas de utilizadores sobre desempenho reduzido, a equipa reverteu a alteração em 7 de abril. O valor predefinido atual é agora “xhigh” para o Opus 4.7 e “high” para outros modelos.

O segundo problema foi um bug introduzido a 26 de março. O sistema foi concebido para limpar registos antigos de raciocínio após a inatividade na conversa exceder uma hora, de modo a reduzir os custos de recuperação da sessão. No entanto, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente em vez de uma única vez, levando o modelo a perder progressivamente o contexto de raciocínio anterior. Isso manifestou-se como aumento de esquecimento, operações repetidas e invocações anormais de ferramentas. O bug também resultou em faltas de cache em cada pedido, acelerando o consumo das quotas dos utilizadores. Dois testes internos não relacionados mascararam as condições de reprodução, alargando o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipa analisou código problemático usando o Opus 4.7 e verificou que o Opus 4.7 conseguia identificar o bug, enquanto o Opus 4.6 não conseguia.

A terceira alteração foi lançada a 16 de abril em conjunto com o Opus 4.7. A equipa adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento, a interação com outros prompts degradou a qualidade da codificação. Uma avaliação alargada revelou uma queda de 3% no desempenho tanto no Opus 4.6 como no 4.7, levando a uma reversão a 20 de abril.

Estas três alterações afetaram grupos de utilizadores diferentes em momentos diferentes, e o efeito combinado criou uma queda de qualidade generalizada e inconsistente, dificultando o diagnóstico. A Anthropic afirmou que agora será necessário envolver mais funcionários internos para utilizarem a mesma versão pública de compilação que os utilizadores, executarem conjuntos completos de avaliação do modelo para cada modificação de prompt do sistema e implementarem períodos de rollout faseado. Como compensação, a Anthropic repôs as quotas de utilização de todos os utilizadores com subscrição.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

R0AR Avança para a Ronda Final do Consensus 2026 PitchFest, falhando por pouco o Top 20

De acordo com a MetaversePost, R0AR avançou para a ronda final de seleção do CoinDesk's Consensus 2026 PitchFest a 4 de maio, falhando por pouco a entrada no top 20 das startups escolhidas para apresentações ao vivo. O inovador em Web3 e IA foi avaliado juntamente com startups de elevado potencial em todo o mundo num dos m

GateNews3h atrás

Musk Procura um Acordo de 150 mil milhões de dólares com a OpenAI antes do julgamento, as negociações falham

De acordo com um documento judicial, Elon Musk contactou o presidente da OpenAI, Greg Brockman, a 26 de abril, dois dias antes de o seu julgamento começar no tribunal federal de Oakland, para explorar um acordo de resolução do litígio. Quando Brockman sugeriu que ambas as partes desistissem das suas alegações, Musk respondeu com ameaças, dizendo a Brockman: «Até ao fim»

GateNews3h atrás

O Cursor aceita a proposta de aquisição da SpaceX de 60 mil milhões de dólares, mas não vai fazer parceria com a xAI em modelos de programação

Segundo a The Information, a Cursor aceitou uma oferta de aquisição condicional de 60 mil milhões de dólares da SpaceX, embora o acordo ainda não tenha sido finalizado. A empresa, neste momento, não tem planos para colaborar com a unidade de IA da SpaceX, xAI, no desenvolvimento de modelos de código. Em vez disso, a Cursor está focada em optimizá-lo

GateNews4h atrás

A Haun Ventures encerra um fundo de 1 mil milhões de dólares a 4 de maio, dividindo o capital entre investimentos cripto em fase inicial e em fase tardia

Segundo a Bloomberg, a Haun Ventures concluiu uma ronda de angariação de 1 mil milhões de dólares a 4 de maio, com 500 milhões de dólares destinados a investimentos em fase inicial e 500 milhões de dólares a investimentos em fase tardia. O fundo irá alocar capital nos próximos dois a três anos, com foco em startups de criptomoedas e de blockchain, enquanto expande

GateNews4h atrás

A OpenAI angaria $4 mil milhões para um empreendimento conjunto de implementação, no valor de 10 mil milhões de dólares

De acordo com a BlockBeats, a 4 de maio, a OpenAI levantou mais de $4 mil milhões para estabelecer uma nova joint venture focada em ajudar as empresas a adotar o seu software de inteligência artificial. A venture, chamada The Deployment Company, conta com o apoio de 19 investidores, incluindo TPG Inc., Brookfield Asset Management,

GateNews5h atrás

Porque é que algumas pessoas acham que a IA vai mudar o mundo, enquanto outras acham que é “normal”? Os dois diagnósticos de Karpathy

Karpathy aponta que a diferença na perceção da IA tem origem em dois diagnósticos: 1) apenas se utilizou modelos gratuitos/antigos, o que não permite refletir a capacidade dos mais avançados modelos agentic; 2) o aumento de capacidades só é claramente significativo em áreas altamente técnicas, e manifesta-se de forma assimétrica. Isto faz com que os utilizadores pagantes e os leitores em geral vejam fenómenos diferentes, criando um mal-entendido mútuo em mundos paralelos. A lição para os leitores de Taiwan é que, para evitar ser influenciado pelas ideias erradas da comunicação social, é necessário usar os modelos mais avançados na prática para realizar tarefas de produção e verificar as bases das decisões.

ChainNewsAbmedia5h atrás
Comentar
0/400
Nenhum comentário