Goldman Sachs: O que o DeepSeek V4 significa para a IA na China?

Autor: Bao Yilong, Wallstreetcn

Goldman Sachs acredita que, o significado central do DeepSeek V4 está em suportar aplicações de agentes mais complexos com custos mais baixos, abrindo assim um novo espaço para a escalabilidade de aplicações de IA.

Em 24 de abril, a equipe de Ronald Keung, do Goldman Sachs, publicou um relatório de pesquisa, afirmando que o novo modelo de código aberto V4 é uma continuação da rota de eficiência prioritária e de código aberto do DeepSeek.

No aspecto técnico, o V4, por meio de uma atualização de arquitetura, realiza uma redução de custos significativa na janela de contexto longa, e aposta claramente nos chips domésticos da Huawei. No aspecto de mercado, esse lançamento acelera a competição de modelos de IA na China, onde habilidades de programação, taxa de conclusão de tarefas e multimodalidade se tornarão os principais fatores de diferenciação de preços.

O Goldman Sachs mantém sua recomendação para os setores de computação em nuvem e centros de dados, pois a melhoria contínua na eficiência de custos de computação impulsionará a penetração acelerada de aplicações de IA, com o crescimento de agentes de IA para empresas e assistentes de IA para consumidores, formando uma dupla dinâmica que sustentará a capacidade de precificação dos serviços em nuvem.

Atualização da arquitetura V4, suportando contextos mais longos com menos memória

DeepSeek V4 foi lançado em duas versões: Pro e Flash.

A versão Pro é de escala de ponta, com 1,6 trilhão de parâmetros (490 milhões de parâmetros ativados); a versão Flash é mais leve, com 284 bilhões de parâmetros (130 milhões de parâmetros ativados). Ambas suportam janelas de contexto de até 1 milhão de tokens, iguais aos principais modelos dos EUA (SOTA), mas com uso de memória e cache KV significativamente reduzidos.

De acordo com o relatório do Goldman Sachs, o V4 Pro, em cenários de 1 milhão de tokens de contexto, requer apenas 27% das operações de ponto flutuante (FLOPs) do DeepSeek V3.2 para inferência de tokens, e o cache KV ocupa apenas 10%; o V4 Flash é ainda mais agressivo, com FLOPs reduzidos a 10% e cache KV comprimido a 7%.

Esse avanço de eficiência é alcançado por meio de três inovações arquitetônicas principais:

  • No aspecto do mecanismo de atenção híbrido, o V4 introduz uma arquitetura híbrida de atenção esparsa comprimida (CSA) e atenção altamente comprimida (HCA). A CSA realiza compressão sequencial do cache KV antes do cálculo de atenção esparsa, enquanto a HCA usa compressão mais agressiva, mas mantém atenção densa, colaborando para reduzir drasticamente a memória temporária necessária para entradas longas.

  • No aspecto da estabilidade de treinamento, o V4 introduz o mecanismo mHC, que reforça a estabilidade na transmissão de informações através de múltiplas camadas da rede;

  • Ao mesmo tempo, utiliza o Muon como otimizador principal de treinamento (com algumas partes usando AdamW), para acomodar arquiteturas de rede mais complexas do que as do V3, melhorando a qualidade de convergência durante o treinamento.

O Goldman Sachs destaca que esses ganhos de eficiência são mais relevantes em tarefas de longo prazo, como tarefas de agentes de longo ciclo que requerem processamento de grandes volumes de contexto.

Vale notar que, atualmente, o DeepSeek ainda se concentra em modelos de texto básicos, enquanto gigantes da internet como Alibaba, ByteDance, MiniMax e outros preferem rotas multimodais ou de múltiplos modos, havendo uma clara diferenciação na trajetória de exploração de AGI.

Chips domésticos aceleram implementação, Huawei Ascend 950 abre espaço para redução de preços

Outro sinal importante do lançamento do V4 é que o DeepSeek deixou claro que a produção em massa do supernóide Huawei Ascend 950 faz parte de sua estratégia comercial.

O DeepSeek espera que, com a implementação em larga escala do supernóide Huawei Ascend 950 na segunda metade de 2026, os preços da API do V4 Pro possam diminuir significativamente.

O relatório do Goldman Sachs indica que essa declaração tem duplo significado:

Primeiro, a competitividade de custos do DeepSeek será ainda mais fortalecida, criando condições para uma implementação mais ampla; segundo, diante do aperto contínuo de chips, a tendência de migração de modelos de IA de ponta na China para hardware doméstico recebe o respaldo claro dos principais players.

Com os preços atuais, os dados do Goldman Sachs mostram que o V4 Pro já possui preços competitivos nas principais plataformas de API, e com a expansão da oferta de capacidade de computação doméstica, essa vantagem deve se ampliar ainda mais na segunda metade de 2026.

Competição de modelos de IA na China entra em fase de diferenciação

O lançamento de código aberto do DeepSeek V4 rapidamente desencadeou uma nova rodada de acompanhamento intenso por parte do ecossistema de modelos de IA na China.

Segundo o Goldman Sachs, os principais players que recentemente lançaram novos modelos incluem: Kimi K2.6, Alibaba Qwen3.6-Max, Tencent Hy3 (prévia), Xiaomi V2.5, e o MiniMax M3/Hailuo, previsto para maio.

Na visão do Goldman Sachs, os fatores-chave que determinarão a diferenciação de preços entre os modelos no futuro se concentram em dois aspectos:

Taxa de sucesso na programação/conclusão de tarefas, com o modelo GLM da Zhispan liderando em capacidade de código;
Capacidade multimodal, com ByteDance, Alibaba e MiniMax investindo mais profundamente nessa direção.

O relatório aponta que há vantagens e desvantagens claras entre os dois tipos de players:

Jogadores independentes de IA, como o MiniMax, têm alta eficiência organizacional e cadeias de decisão curtas, podendo alcançar 40% de margem bruta mesmo com preços extremamente baixos em APIs de texto básico, segundo previsões do Goldman Sachs;
Grandes empresas de internet, como ByteDance, Tencent e Alibaba, possuem fluxo de caixa robusto em seus negócios principais, sendo mais adequadas para investir em infraestrutura de IA e no setor de nuvem, com a necessidade de criar equipes de IA independentes e planos de incentivo para reter talentos, como a equipe do Doubao da ByteDance, que já possui incentivos independentes.

Vale destacar que o relatório do Goldman Sachs cita notícias de que Tencent e Alibaba estão negociando investimentos na DeepSeek por mais de 20 bilhões de dólares de avaliação, enquanto Zhispan e MiniMax têm avaliações de aproximadamente 53 bilhões e 31 bilhões de dólares, respectivamente, refletindo uma disputa de gigantes por capacidades de IA de ponta escassas.

Lógica de prioridade no setor: computação em nuvem e centros de dados

O Goldman Sachs mantém sua avaliação de que a computação em nuvem e os centros de dados continuam sendo os principais subsetores preferidos na China, com a lógica de:

A demanda contínua por tokens de IA impulsionará a aquisição de serviços em nuvem;

O crescimento de clientes corporativos e agentes de IA melhora a capacidade de precificação de serviços em nuvem e tokens;

A penetração contínua de assistentes de IA para consumidores finais contribui para demandas adicionais.

No mercado de nuvem para empresas (To-B), a Alibaba lidera com a maior receita de nuvem de IA externa; no mercado de consumo (To-C), a ByteDance atualmente é a plataforma com maior uso diário de tokens em chatbots de IA, e as aplicações de AIGC na China continuam crescendo forte, com um aumento de 36% na taxa de crescimento mensal de março de 2026.

Em relação às ações recomendadas, o Goldman Sachs continua destacando a GDS, Century Internet, Alibaba e Kingsoft Cloud como principais ativos para aproveitar os benefícios da expansão da infraestrutura de IA na China.

Além disso, o segundo nível inclui ações relacionadas a comércio eletrônico e mobilidade, enquanto o terceiro nível abrange ações de modelos de IA, e o quarto nível inclui jogos e entretenimento.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar