A prévia do Hy3 open source da Tencent melhora em 40% os testes de benchmark de código em relação à versão anterior

騰訊開源Hy3預覽版

A Tencent lançou oficialmente o modelo de linguagem grande Hy3 em versão preview como open source em 23 de abril nas plataformas GitHub, Hugging Face e ModelScope, e também disponibilizou simultaneamente um serviço de API paga no Tencent Cloud. De acordo com um relatório da Decrypt em 24 de abril, a versão preview do Hy3 iniciou o treinamento no final de janeiro e, na data de publicação, tinha menos de três meses.

Arquitetura do modelo Hy3 e contexto de desenvolvimento

De acordo com o anúncio oficial da Tencent, o Hy3 em versão preview é uma arquitetura de especialistas mistos, que direciona cada rota de consulta para um subconjunto de sub-redes de especialistas específicos para processamento, em vez de ativar todos os parâmetros de forma síncrona, a fim de reduzir a necessidade de computação.

O modelo flagship da geração anterior Hy2 tinha mais de 400 bilhões de parâmetros. A declaração oficial da Tencent afirma que 295 bilhões são a configuração com melhor otimização de eficiência para inferência; acima desse porte, a utilidade marginal de aumentar parâmetros não compensa mais.

De acordo com a reportagem da Decrypt, o trabalho de treinamento do Hy3 foi liderado pelo cientista-chefe de inteligência artificial da Tencent, Yao Shunyu (姚顺宇). Após a reconstrução das infraestruturas base para o empilhamento de pré-treinamento e aprendizado por reforço ter sido concluída em fevereiro de 2026, o treinamento do Hy3 foi oficialmente iniciado.

Dados de testes de referência principais

De acordo com os resultados de testes de referência divulgados no anúncio oficial da Tencent:

SWE-bench Verified (correção de erros de código real do GitHub):Hy3 preview 74,4%, Hy2 53,0%; no mesmo período, GLM-5 77,8%, Kimi-K2.5 76,8%, Claude Opus 4,6 80,8%

Terminal-Bench 2.0 (execução de tarefas autônomas via linha de comando):Hy3 preview 54,4%, Hy2 23,2%

BrowseComp (tarefas complexas de busca na web):Hy3 preview 67,1%, Hy2 28,7%

WideSearch:Hy3 preview 70,2%, acima do GLM-5 e Kimi-K2.5, abaixo do Claude Opus 4,6 em 77,2%

Prova de qualificação para doutorado em Matemática da Universidade Tsinghua (primavera de 2026):média das três execuções (avg@3) 88,4, maior pontuação entre modelos chineses

Olimpíada de Biologia para Estudantes do Ensino Médio na China 2025 (CHSBO 2025):87,8 pontos, maior pontuação entre modelos chineses da mesma categoria

Plataformas de implantação e preços de API

De acordo com o anúncio oficial da Tencent, a versão preview do Hy3 já foi implantada nas seguintes plataformas: Yuanbao(元宝)、QQ、Tencent Docs(騰訊文件)、CodeBuddy、WorkBuddy e OpenClaw.

O preço da API no Tencent Cloud é de 0,18 dólar por milhão de tokens de entrada e 0,59 dólar por milhão de tokens de saída; a mensalidade do plano de tokens pessoais começa em cerca de 4,10 dólares. O anúncio da Tencent também mostra que, no CodeBuddy e WorkBuddy, o atraso no primeiro token do Hy3 foi reduzido em 54% em relação ao modelo anterior, o tempo de geração ponta a ponta foi reduzido em 47%, e o fluxo de trabalho de agente de 495 etapas foi concluído com sucesso.

Perguntas frequentes

Quando a versão preview do Tencent Hy3 será lançada e em quais plataformas pode ser obtida?

De acordo com o anúncio oficial da Tencent e com a reportagem da Decrypt em 24 de abril de 2026, a versão preview do Hy3 será disponibilizada como open source em 23 de abril de 2026 (quinta-feira) no GitHub, Hugging Face e ModelScope, e a Tencent Cloud também fornece simultaneamente um serviço de API paga.

Em comparação com o modelo anterior Hy2, quais são as principais diferenças nos testes de referência do Hy3 preview?

De acordo com o anúncio oficial da Tencent, a pontuação do SWE-bench Verified subiu de 53,0% do Hy2 para 74,4%; BrowseComp subiu de 28,7% para 67,1%; Terminal-Bench 2.0 subiu de 23,2% para 54,4%.

Qual é o preço de API da versão preview do Hy3?

De acordo com a tabela oficial de preços do Tencent Cloud, a API da versão preview do Hy3 tem preço inicial de 0,18 dólar por milhão de tokens de entrada e 0,59 dólar por milhão de tokens de saída; a mensalidade do plano de tokens pessoais começa em cerca de 4,10 dólares.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Ex-engenheiro da Seed da ByteDance: A iteração de IA da ByteDance leva seis meses vs. os três meses do Google

Mensagem do Gate News, 24 de abril — Zhang Chi, ex-engenheiro da equipe Seed da ByteDance e atual professor assistente na Universidade de Pequim, revelou no podcast "Into Asia" que a ByteDance exige aproximadamente seis meses para concluir um ciclo completo de treinamento de pré-treinamento de modelo de linguagem grande (

GateNews9m atrás

Engenheiro da OpenAI Clive Chan questiona recomendações de hardware da V4, citando erros e falta de clareza em relação à V3

Mensagem do Gate News, 24 de abril — o engenheiro da OpenAI, Clive Chan, levantou objeções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-o de "surpreendentemente medíocre e propenso a erros" em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A

GateNews41m atrás

Naver lança beta do AI Tab à medida que o Google Gemini entra no mercado de buscas da Coreia do Sul

Mensagem do Gate News, 24 de abril — A Naver anunciou o início de um beta fechado para o AI Tab, seu novo recurso de busca conversacional, após o lançamento do Gemini pela Google no Chrome na Coreia do Sul. O AI Tab aparecerá ao lado das abas de busca existentes da Naver, oferecendo aos usuários um espaço dedicado para consultas conversacionais

GateNews53m atrás

Contratação de Engenharia de IA na Índia dispara 59,5%, se expande além dos hubs de tecnologia

Relatório do Mercado de Trabalho de IA da LinkedIn 2026, divulgado em 24 de abril, descobriu que as contratações de engenharia de IA na Índia aumentaram 59,5% ano contra ano, marcando o ritmo mais rápido entre os mercados estudados pela plataforma. O crescimento foi impulsionado pela demanda se expandindo além dos centros tecnológicos estabelecidos. Cidades incluindo

CryptoFrontier1h atrás

Banco Commonwealth Reduz 120 Empregos Com a Expansão da IA

O Commonwealth Bank of Australia anunciou que vai cortar aproximadamente 120 empregos enquanto o maior banco do país revisa funções e amplia o uso de inteligência artificial, de acordo com a Bloomberg. Os cortes incluem 43 funções no Bankwest, na Austrália Ocidental, com seis cargos afetados pela automação. Isto é

CryptoFrontier1h atrás

A Cursor revela as razões do treinamento de XAI: o poder de computação ficou travado, e a SpaceX, por sua vez, detém opções de compra no valor de 60 bilhões de dólares

A Anysphere anunciou que o Cursor irá, com a xAI, usar a infraestrutura Colossus para treinar novos modelos e superar a limitação de capacidade de computação; a SpaceX propôs uma opção de aquisição de US$ 60 bilhões (aquisição total dentro de 2026), e, caso não dê certo, pagará aproximadamente US$ 10 bilhões como compensação de colaboração. As duas transações ocorrem ao mesmo tempo, remodelando quem pode treinar o Cursor e quem pode comprar o Cursor; o Cursor ainda permite muitos backends de modelos, mas, a longo prazo, o caminho depende de a SpaceX exercer o direito de aquisição.

ChainNewsAbmedia1h atrás
Comentário
0/400
Sem comentários