De acordo com o documento oficial de aposentadoria dos modelos da Anthropic, o Claude Haiku 3 (ID do modelo: claude-3-haiku-20240307) foi oficialmente encerrado em 19 de abril de 2026. Após essa data, todas as requisições de API para esse modelo retornarão diretamente um erro; a Anthropic não fará o redirecionamento automático do tráfego para uma versão nova, e os desenvolvedores devem atualizar proativamente o ID do modelo no código para o Haiku 4.5. Este é o primeiro grande evento de término do ciclo de vida (lifecycle) de um modelo Claude neste ano.

O impacto é principalmente em aplicativos leves

O Claude Haiku 3 foi lançado em março de 2024 e, na época, era o modelo mais barato e mais rápido da Anthropic, sendo amplamente usado em tarefas frequentes e leves, como bots de atendimento ao cliente, sumarização, classificação, moderação de conteúdo e afins. Dois anos depois, até hoje, muitos SaaS de pequeno e médio porte e ferramentas internas ainda utilizam esse modelo, porque o prompt e os custos já foram profundamente ajustados; substituir exigiria refazer o QA completo. O aviso de aposentadoria começou em fevereiro. A Anthropic emitiu pelo menos 60 dias de notificação prévia aos clientes empresariais com contratos por meio de comunicações oficiais, email e alertas no dashboard.

Duas mudanças destrutivas para migrar para o Haiku 4.5

A solução alternativa recomendada pela empresa é o Claude Haiku 4.5, mas a migração não é apenas modificar uma string. Os desenvolvedores precisam observar duas mudanças destrutivas: primeiro, que os parâmetros de amostragem temperature e top_p agora permitem apenas escolher um deles; se o código existente definir valores explícitos para ambos, a API da Anthropic retornará um erro. Segundo, o Haiku 4.5 adiciona refusal stop reason; quando o modelo recusa uma resposta, ele retorna essa marca, e não — como no Haiku 3 — um error direto ou a devolução de um placeholder. O código do produto precisa tratar a refusal como um caminho normal.

Além disso, a controvérsia na semana passada sobre o aumento “silencioso” na cobrança causado por uma mudança no tokenizer do Opus 4.7 também pode se aplicar ao Haiku 4.5 — mesmo que a rate card mostre um preço por token menor, o consumo real de tokens nas tarefas do dia a dia pode variar devido a diferenças no tokenizer. Recomenda-se que todos os planos de migração façam medições reais no dia da troca para comparar os custos.

Gerenciamento do ciclo de vida de modelos de IA vira conteúdo obrigatório para empresas

O alerta desta aposentadoria destaca uma mudança estrutural nas infraestruturas de IA das empresas: os LLMs deixaram a fase de “aquisição única” e entraram na etapa de “gerenciamento contínuo de versões”, semelhante a serviços em nuvem e sistemas operacionais. A página oficial de deprecação da Anthropic também anuncia que o Claude Opus 4 e o Sonnet 4 serão aposentados em 15 de junho de 2026, com um cronograma bem concentrado. As cláusulas de aquisição de IA das empresas devem incluir itens contratuais como “período mínimo de suporte”, “modelos alternativos automaticamente disponíveis”, “subsídio para testes de migração” e semelhantes; caso contrário, serviços em produção podem ser interrompidos devido à remoção do modelo.

Recomendações de ação para desenvolvedores em Taiwan e equipes de SaaS

Três ações imediatas: primeiro, buscar todos os repositórios de código e arquivos de configuração, e substituir claude-3-haiku-20240307 por claude-haiku-4-5; segundo, verificar se nas chamadas de API a temperature e o top_p são definidos ao mesmo tempo; manter apenas um; terceiro, adicionar no handler um ramo de tratamento para a refusal stop reason, para evitar erro acidental voltado ao usuário. Para organizações com contratos empresariais de cobrança por uso, monitorar também a variação do consumo de tokens na semana da troca é uma ação necessária, para evitar gastos inesperados causados por diferenças de tokenizer.

Este artigo: Aposentadoria oficial do Claude Haiku 3 em 4/19 — Anthropic força migração para Haiku 4.5; desenvolvedores devem alterar o ID do modelo e as configurações de parâmetros. Foi a primeira vez que apareceu em Lian Xinwen ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

O fundador da Pi Network em 7 de maio discutiu a identificação da identidade humana na era da IA no Consensus 2026

pi network news Parcerias e ecossistema Notícias do setor de IA

O fundador da Pi Network, Nicolas Kokkalis, participará no dia 7 de maio da conferência Consensus 2026, em Miami, juntando-se a um painel de especialistas que discutirá o tema de identificação humana on-line na era da inteligência artificial (IA). De acordo com a programação oficial do evento, esta discussão em painel reunirá especialistas nas áreas de identidade, privacidade e confiança digital.

MarketWhisper13m atrás

DeepX e Hyundai Motor Group Desenvolvem Plataforma de Chip de IA de Baixo Consumo para Robôs

Notícias do setor de IA Ferramentas e apps de IA

A DeepX, da Coreia do Sul, e o Robotics Lab do Hyundai Motor Group estão colaborando em uma plataforma de computação de IA de baixo consumo para aplicações robóticas em tempo real. Utilizando o chip DX-M2 da DeepX, a parceria busca otimizar robôs com custos e consumo de energia reduzidos, refletindo uma tendência do setor em direção a chips especializados.

GateNews21m atrás

Playdate Proíbe Arte, Música e Texto Gerados por IA; Assistentes de Código Ainda São Permitidos

Notícias do setor de IA

A Panic Inc. anunciou uma proibição de ferramentas de IA generativa para arte, música, escrita e diálogos em jogos para o console Playdate. Assistentes de codificação por IA são permitidos com divulgação. A decisão segue reação negativa a um jogo desenvolvido com IA.

GateNews31m atrás

A Amazon adiciona um investimento de 5 bilhões na Anthropic e um acordo de 10 anos com a AWS garante computação de 1 trilhão

Notícias do setor de IA

A Amazon anunciou em 20 de abril um investimento adicional de US$ 5 bilhões na Anthropic, fazendo com que o total acumulado de compromissos de investimento desde 2023 alcance US$ 13 bilhões, e deixando espaço para fundos adicionais vinculados a um marco comercial futuro de até US$ 20 bilhões. Em contrapartida, a Anthropic se compromete a investir mais de US$ 100 bilhões na infraestrutura da AWS nos próximos dez anos, em troca de recursos computacionais de 5 GW.

MarketWhisper47m atrás

Deputados de Nova York propõem “bônus de IA” para lidar com a onda de desemprego; o Goldman Sachs estima uma perda mensal de 16 mil empregos

Notícias do setor de IA

O deputado estadual de Nova York e candidato ao Congresso Alex Bores anunciou no domingo um plano de “bônus de IA”, que visa pagar diretamente aos cidadãos americanos quando a inteligência artificial substituir de forma significativa os trabalhadores dos EUA. O contexto para o anúncio do plano é que um relatório do Goldman Sachs mostra que a popularização da IA já levou à perda de cerca de 16 mil vagas de emprego por mês nos Estados Unidos, e grandes empresas de tecnologia como Amazon, Meta, Intel e Microsoft anunciaram demissões em larga escala sucessivamente.

MarketWhisper52m atrás

O QClaw internacional da Tencent inicia testes em fase beta, com 700 dólares em tokens para os usuários do Japão entrarem primeiro na fila

Eventos de tokens Agente de IA Notícias do setor de IA

O produto de agentes de IA da QClaw, da equipe do Tencent PC Manager, anunciou em 20 de abril que a versão internacional foi oficialmente aberta para testes em fase inicial. A primeira leva abrange os Estados Unidos, Canadá, Singapura e Coreia do Sul, com suporte a vários idiomas, como chinês, inglês, francês, espanhol e coreano. Durante o período de testes, serão oferecidos diariamente 40 milhões de Tokens, ao mesmo tempo em que serão abertos os primeiros 20.000 lugares para “Founding Claw (創始龍蝦)”, por ordem de chegada.

MarketWhisper1h atrás

Comentário

0/400

Sem comentários