De acordo com o documento oficial de aposentadoria dos modelos da Anthropic, o Claude Haiku 3 (ID do modelo: claude-3-haiku-20240307) foi oficialmente encerrado em 19 de abril de 2026. Após essa data, todas as requisições de API para esse modelo retornarão diretamente um erro; a Anthropic não fará o redirecionamento automático do tráfego para uma versão nova, e os desenvolvedores devem atualizar proativamente o ID do modelo no código para o Haiku 4.5. Este é o primeiro grande evento de término do ciclo de vida (lifecycle) de um modelo Claude neste ano.
O impacto é principalmente em aplicativos leves
O Claude Haiku 3 foi lançado em março de 2024 e, na época, era o modelo mais barato e mais rápido da Anthropic, sendo amplamente usado em tarefas frequentes e leves, como bots de atendimento ao cliente, sumarização, classificação, moderação de conteúdo e afins. Dois anos depois, até hoje, muitos SaaS de pequeno e médio porte e ferramentas internas ainda utilizam esse modelo, porque o prompt e os custos já foram profundamente ajustados; substituir exigiria refazer o QA completo. O aviso de aposentadoria começou em fevereiro. A Anthropic emitiu pelo menos 60 dias de notificação prévia aos clientes empresariais com contratos por meio de comunicações oficiais, email e alertas no dashboard.
Duas mudanças destrutivas para migrar para o Haiku 4.5
A solução alternativa recomendada pela empresa é o Claude Haiku 4.5, mas a migração não é apenas modificar uma string. Os desenvolvedores precisam observar duas mudanças destrutivas: primeiro, que os parâmetros de amostragem temperature e top_p agora permitem apenas escolher um deles; se o código existente definir valores explícitos para ambos, a API da Anthropic retornará um erro. Segundo, o Haiku 4.5 adiciona refusal stop reason; quando o modelo recusa uma resposta, ele retorna essa marca, e não — como no Haiku 3 — um error direto ou a devolução de um placeholder. O código do produto precisa tratar a refusal como um caminho normal.
Além disso, a controvérsia na semana passada sobre o aumento “silencioso” na cobrança causado por uma mudança no tokenizer do Opus 4.7 também pode se aplicar ao Haiku 4.5 — mesmo que a rate card mostre um preço por token menor, o consumo real de tokens nas tarefas do dia a dia pode variar devido a diferenças no tokenizer. Recomenda-se que todos os planos de migração façam medições reais no dia da troca para comparar os custos.
Gerenciamento do ciclo de vida de modelos de IA vira conteúdo obrigatório para empresas
O alerta desta aposentadoria destaca uma mudança estrutural nas infraestruturas de IA das empresas: os LLMs deixaram a fase de “aquisição única” e entraram na etapa de “gerenciamento contínuo de versões”, semelhante a serviços em nuvem e sistemas operacionais. A página oficial de deprecação da Anthropic também anuncia que o Claude Opus 4 e o Sonnet 4 serão aposentados em 15 de junho de 2026, com um cronograma bem concentrado. As cláusulas de aquisição de IA das empresas devem incluir itens contratuais como “período mínimo de suporte”, “modelos alternativos automaticamente disponíveis”, “subsídio para testes de migração” e semelhantes; caso contrário, serviços em produção podem ser interrompidos devido à remoção do modelo.
Recomendações de ação para desenvolvedores em Taiwan e equipes de SaaS
Três ações imediatas: primeiro, buscar todos os repositórios de código e arquivos de configuração, e substituir claude-3-haiku-20240307 por claude-haiku-4-5; segundo, verificar se nas chamadas de API a temperature e o top_p são definidos ao mesmo tempo; manter apenas um; terceiro, adicionar no handler um ramo de tratamento para a refusal stop reason, para evitar erro acidental voltado ao usuário. Para organizações com contratos empresariais de cobrança por uso, monitorar também a variação do consumo de tokens na semana da troca é uma ação necessária, para evitar gastos inesperados causados por diferenças de tokenizer.
Este artigo: Aposentadoria oficial do Claude Haiku 3 em 4/19 — Anthropic força migração para Haiku 4.5; desenvolvedores devem alterar o ID do modelo e as configurações de parâmetros. Foi a primeira vez que apareceu em Lian Xinwen ABMedia.
Related Articles
O fundador da Pi Network em 7 de maio discutiu a identificação da identidade humana na era da IA no Consensus 2026
DeepX e Hyundai Motor Group Desenvolvem Plataforma de Chip de IA de Baixo Consumo para Robôs
Playdate Proíbe Arte, Música e Texto Gerados por IA; Assistentes de Código Ainda São Permitidos
A Amazon adiciona um investimento de 5 bilhões na Anthropic e um acordo de 10 anos com a AWS garante computação de 1 trilhão
Deputados de Nova York propõem “bônus de IA” para lidar com a onda de desemprego; o Goldman Sachs estima uma perda mensal de 16 mil empregos
O QClaw internacional da Tencent inicia testes em fase beta, com 700 dólares em tokens para os usuários do Japão entrarem primeiro na fila