腾讯开源 Hy3 预览版,代码基准测试较前代提升 40%

Market Whisper

騰訊開源Hy3預覽版

腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型,并同步于腾讯云(Tencent Cloud)提供付费 API 服务。据 Decrypt 于 4 月 24 日报道,Hy3 预览版自 1 月下旬启动训练,至发布日历时不足三个月。

Hy3 模型架构与开发背景

根据腾讯官方公告,Hy3 预览版为混合专家架构,将各查询路由至指定专家子网络子集处理,而非异步启用全部参数,以降低计算需求。

前一代旗舰模型 Hy2 的参数量逾 4,000 亿。腾讯官方声明指出,2,950 亿为推理效益优化后的设置,超出此规模后增加参数的边际效益不再划算。

根据 Decrypt 报导,Hy3 的训练工作由腾讯首席人工智能科学家姚顺宇(Yao Shunyu)主导,其于 2026 年 2 月完成预训练与强化学习堆叠的基础设施重建后,Hy3 训练正式展开。

关键基准测试数据

根据腾讯官方公告所披露的基准测试结果:

SWE-bench Verified(GitHub 真实代码错误修复):Hy3 预览版 74.4%,Hy2 为 53.0%;同期 GLM-5 为 77.8%,Kimi-K2.5 为 76.8%,Claude Opus 4.6 为 80.8%

Terminal-Bench 2.0(命令行自主执行任务):Hy3 预览版 54.4%,Hy2 为 23.2%

BrowseComp(复杂网络搜索任务):Hy3 预览版 67.1%,Hy2 为 28.7%

WideSearch:Hy3 预览版 70.2%,高于 GLM-5 及 Kimi-K2.5,低于 Claude Opus 4.6 的 77.2%

清华大学数学博士资格考试(2026 年春季):三次运行平均分(avg@3)88.4,为中国模型最高分

2025 年中国高中生物奥林匹克竞赛(CHSBO 2025):87.8 分,为同类中国模型最高分

部署平台与 API 定价

根据腾讯官方公告,Hy3 预览版已部署于以下平台:元宝(Yuanbao)、QQ、腾讯文档(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。

腾讯云端 API 定价为每百万输入标记 0.18 美元、每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。腾讯公告亦显示,Hy3 在 CodeBuddy 与 WorkBuddy 上的首标记延迟较前代降低 54%,端对端生成时间缩短 47%,并成功完成 495 步骤的代理工作流程。

常见问题

腾讯 Hy3 预览版何时发布,可在哪些平台取得?

根据腾讯官方公告及 Decrypt 2026 年 4 月 24 日报道,Hy3 预览版于 2026 年 4 月 23 日(周四)在 GitHub、Hugging Face 及 ModelScope 开源,腾讯云端同步提供付费 API 服务。

Hy3 预览版与前代模型 Hy2 相比,主要基准测试差异为何?

根据腾讯官方公告,SWE-bench Verified 评分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。

Hy3 预览版的 API 定价为何?

根据腾讯云端官方定价,Hy3 预览版 API 起价为每百万输入标记 0.18 美元,每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

DeepSeek V4-Flash 登上 Ollama Cloud、美國主機:Claude Code、OpenClaw 一鍵串接

Ollama Cloud 已上架 DeepSeek V4-Flash,推理在美国主机,提供三组一键指令接入 Claude Code、OpenClaw、Hermes。V4-Flash/V4-Pro 采用 MoE 架构、原生支持 1M 上下文,并以 Token-wise 压缩+DSA 稀疏注意力降低成本,1M 情境下单 token FLOPs 降低 27%、KV 缓存降低 10%。API 相容 OpenAI ChatCompletions 与 Anthropic,便于多工作流切换,降低成本与数据主权风险。

鏈新聞abmedia1小时前

Web3 AI 基础设施 AIW3 完成 $2M 种子轮融资,Buffalo Capital 牵头

Gate News 消息,4月24日——Web3 AI 基础设施平台 AIW3 宣布完成一轮 $2 百万美元种子轮融资。本轮融资由 Buffalo Capital 牵头,GalaXin Capital 和 Three-stones Ventures 参与作为共同投资方。 AIW3 正在向 Agent-as-a-Service

GateNews1小时前

Cohere 收购德国 AI 公司 Aleph Alpha,斩获 $600M 投资用于欧洲扩张

Gate 新闻消息,4月24日——加拿大 AI 公司 Cohere 宣布计划收购德国 AI 公司 Aleph Alpha,以加强其在欧洲的布局。Aleph Alpha 的支持方 Schwarz Group 计划在 Cohere 的 E 轮融资中投资 $600 百万。 预计该融资轮将于 202

GateNews2小时前

小鹏、Redmi 牵头:北京车展上的车载 AI 推进

快讯,4月24日——随着中国加速推进 AI Plus 战略,并寻求在国外半导体方面获得更大独立性,中国车企在4月24日的北京车展上展示了先进的车载 AI 系统。 小鹏展示了语音控制泊车功能,允许驾驶员“通过

GateNews3小时前

前字节跳动 Seed 工程师:字节跳动 AI 迭代需六个月,而谷歌为三个月

Gate News 消息,4 月 24 日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客《Into Asia》中透露,字节跳动完成一次完整的大型语言模型训练 (预训练循环大约需要六个月

GateNews3小时前

OpenAI 工程师 Clive Chan 挑战 V4 硬件建议,称其相较 V3 存在错误与模糊之处

Gate News 消息,4 月 24 日——OpenAI 工程师 Clive Chan 就 V4 技术报告中的硬件建议章节提出了详细异议,称其“出人意料地平庸且容易出错”,与备受赞誉的 V3 版本相比尤为如此。V3 的硬件指导,其中包括问答(Q&A)环节

GateNews3小时前
评论
0/400
暂无评论