Tencent a ouvert Hy3 en version d’aperçu (large modèle de langage) de manière officielle sur GitHub, Hugging Face et ModelScope le 23 avril, et l’a également mise à disposition sous forme de service d’API payant sur Tencent Cloud. Selon un rapport de Decrypt daté du 24 avril, la version d’aperçu de Hy3 a démarré l’entraînement à la fin du mois de janvier et, à la date de publication, il ne s’est pas écoulé plus de trois mois.

Architecture du modèle Hy3 et contexte de développement

D’après l’annonce officielle de Tencent, la version d’aperçu de Hy3 est une architecture de type “experts mixtes” : elle dirige chaque requête vers un sous-ensemble de réseaux d’experts dédié au lieu d’activer tous les paramètres de manière simultanée, afin de réduire les besoins de calcul.

Le modèle phare de la génération précédente, Hy2, comptait plus de 400 milliards de paramètres. Tencent a déclaré que 295 milliards constituent un réglage optimisé pour l’efficacité d’inférence ; au-delà de ce volume, l’utilité marginale de l’ajout de paramètres ne vaut plus le coût.

Selon le rapport de Decrypt, le travail d’entraînement de Hy3 est mené par le scientifique en chef de l’IA chez Tencent, Yao Shunyu. Après avoir achevé en février 2026 la reconstruction des infrastructures de base pour le pré-entraînement et l’empilement de l’apprentissage par renforcement, l’entraînement de Hy3 a officiellement commencé.

Données de tests de référence clés

D’après les résultats de tests de référence divulgués par l’annonce officielle de Tencent :

SWE-bench Verified (correction de vraies erreurs de code sur GitHub) : Hy3 version d’aperçu 74,4 %, Hy2 53,0 % ; sur la même période GLM-5 77,8 %, Kimi-K2.5 76,8 %, Claude Opus 4,6 80,8 %

Terminal-Bench 2.0 (exécution de tâches à partir de la ligne de commande) : Hy3 version d’aperçu 54,4 %, Hy2 23,2 %

BrowseComp (tâches complexes de recherche web) : Hy3 version d’aperçu 67,1 %, Hy2 28,7 %

WideSearch : Hy3 version d’aperçu 70,2 %, supérieur à GLM-5 et Kimi-K2.5, inférieur à Claude Opus 4,6 de 77,2 %

Examen d’admission au doctorat en mathématiques de l’Université Tsinghua (printemps 2026) : moyenne sur trois sessions (avg@3) 88,4, le meilleur score parmi les modèles chinois

Olympiade chinoise de biologie pour lycéens 2025 (CHSBO 2025) : 87,8 points, le meilleur score parmi les modèles chinois de même catégorie

Plateformes de déploiement et tarification des API

Selon l’annonce officielle de Tencent, la version d’aperçu de Hy3 a été déployée sur les plateformes suivantes : Yuanbao, QQ, Tencent Docs, CodeBuddy, WorkBuddy et OpenClaw.

La tarification des API sur le cloud de Tencent est de 0,18 USD pour chaque million de jetons d’entrée et de 0,59 USD pour chaque million de jetons de sortie ; le tarif mensuel de départ du plan de marquage personnel est d’environ 4,10 USD. L’annonce de Tencent indique également qu’avec Hy3, le délai du premier marquage sur CodeBuddy et WorkBuddy a été réduit de 54 % par rapport à la génération précédente, que le temps de génération end-to-end a été réduit de 47 %, et que le flux de travail d’agent de 495 étapes a été mené à bien avec succès.

FAQ

Quand la version d’aperçu de Tencent Hy3 sera-t-elle publiée, et sur quelles plateformes pourra-t-on l’obtenir ?

D’après l’annonce officielle de Tencent et le rapport de Decrypt du 24 avril 2026, la version d’aperçu de Hy3 a été open source le 23 avril 2026 (jeudi) sur GitHub, Hugging Face et ModelScope ; en parallèle, Tencent Cloud fournit également un service d’API payant.

Par rapport au modèle précédent Hy2, quelles sont les principales différences de tests de référence pour la version d’aperçu de Hy3 ?

D’après l’annonce officielle de Tencent, la note SWE-bench Verified passe de 53,0 % pour Hy2 à 74,4 % ; BrowseComp passe de 28,7 % à 67,1 % ; Terminal-Bench 2.0 passe de 23,2 % à 54,4 %.

Quel est le tarif des API de la version d’aperçu de Hy3 ?

D’après la tarification officielle sur Tencent Cloud, les API de la version d’aperçu de Hy3 démarrent à 0,18 USD pour chaque million de jetons d’entrée et à 0,59 USD pour chaque million de jetons de sortie ; le tarif mensuel de départ du plan de marquage personnel est d’environ 4,10 USD.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

DeepSeek V4-Flash arrive sur Ollama Cloud, hôtes américains : Claude Code, OpenClaw connexion en un clic

Actualités de l’industrie de l’IA Outils et apps IA

Ollama Cloud a mis en ligne DeepSeek V4-Flash, avec l'inférence sur des serveurs aux États-Unis, et propose trois ensembles de commandes en un clic pour se connecter à Claude Code, OpenClaw et Hermes. V4-Flash/V4-Pro utilisent une architecture MoE, avec une prise en charge native du contexte 1M, et réduisent les coûts grâce à une compression Token-wise + une attention clairsemée DSA ; dans un scénario de 1M, les FLOPs par token diminuent de 27 % et le cache KV baisse de 10 %. L'API est compatible avec OpenAI ChatCompletions et Anthropic, ce qui facilite le basculement entre plusieurs flux de travail, réduit les coûts et les risques liés à la souveraineté des données.

ChainNewsAbmediaIl y a 1h

Infrastructure Web3 pour l’IA : AIW3 lève $2M en financement de démarrage, menée par Buffalo Capital

Agent IA Actualités de l’industrie de l’IA

Message de Gate News, 24 avril — La plateforme d’infrastructure Web3 pour l’IA, AIW3, a annoncé l’achèvement d’un tour de financement de démarrage de $2 millions. Le tour a été mené par Buffalo Capital, avec GalaXin Capital et Three-stones Ventures participant en tant qu’investisseurs co-investisseurs. AIW3 passe vers un paradigme d’exécution on-chain Agent-as-a-Service

GateNewsIl y a 1h

Cohere acquiert la société allemande d’IA Aleph Alpha et obtient $600M investissement pour son expansion en Europe

Actualités de l’industrie de l’IA

Message de Gate News, 24 avril — La société canadienne d’intelligence artificielle Cohere a annoncé son projet d’acquérir la société allemande d’IA Aleph Alpha afin de renforcer sa présence en Europe. Le groupe Schwarz, qui soutient Aleph Alpha, prévoit d’investir $600 million dans le tour de financement Série E de Cohere. Le tour de financement devrait se clôturer en 202

GateNewsIl y a 2h

Xpeng et Xiaomi mènent la poussée d’IA embarquée au Salon de l’automobile de Pékin

Actualités de l’industrie de l’IA

Message de Gate News, 24 avril — Les constructeurs automobiles chinois ont présenté, au Salon de l’automobile de Pékin le 24 avril, des systèmes d’IA embarquée avancés, alors que le pays accélère sa stratégie AI Plus et cherche à accroître son indépendance vis-à-vis des semi-conducteurs étrangers. Xpeng a démontré un stationnement contrôlé par la voix qui permet aux conducteurs de «

GateNewsIl y a 3h

Ancien ingénieur de Seed chez ByteDance : l’itération d’IA de ByteDance prend six mois contre trois mois chez Google

Actualités de l’industrie de l’IA

Message de Gate News, 24 avril — Zhang Chi, ancien ingénieur de l’équipe Seed de ByteDance et actuellement professeur assistant à l’Université de Pékin, a révélé dans le podcast "Into Asia" que ByteDance nécessite environ six mois pour achever un cycle complet d’entraînement de pré-entraînement d’un grand modèle de langage (, plus post-training, tandis que Google n’aurait besoin que de trois mois

GateNewsIl y a 3h

L’ingénieur d’OpenAI Clive Chan conteste les recommandations matérielles de la V4, citant des erreurs et un manque de clarté par rapport à la V3

Actualités de l’industrie de l’IA

Message de Gate News, 24 avril — L’ingénieur d’OpenAI Clive Chan a formulé des objections détaillées au chapitre de recommandations matérielles du rapport technique V4, le qualifiant de « remarquablement médiocre et sujet aux erreurs » par rapport à la version V3 acclamée. Les recommandations matérielles de la V3, qui comprenaient des sessions de Q&A

GateNewsIl y a 3h

Commentaire

0/400

Aucun commentaire