Gate 广场「创作者认证激励计划」优质创作者持续招募中!
立即加入,发布优质内容,参与活动即可瓜分月度 $10,000+ 创作奖励!
认证申请步骤:
1️⃣ 打开 App 首页底部【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】,提交申请等待审核
立即报名:https://www.gate.com/questionnaire/7159
豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000 丰厚奖励等你拿!
活动详情:https://www.gate.com/announcements/article/47889
2026开年,DeepSeek的mHC架构又上了新台阶。
说起来,HC在宽度方向上一直存在扩展瓶颈——稳定性差、可扩展性受限。mHC就是来破这个局的。它不仅保持了transformer纵向堆叠的传统打法,关键是在横向打开了并行信息流的大门,让多流并行成为可能。
这意味着什么?模型既能竖着堆,也能横着铺。扩展维度从一维变成了二维。继续scaling,天花板又被推高了一截。