唐杰重新定位智谱上市后战略:回归基础模型掌握的战略转型

2026年1月8日,智谱实现了历史性里程碑,成为全球首家公开上市的大型语言模型公司——这一非凡成就既未被分析师预料,也超出了竞争对手的预期。同日,清华大学计算机系教授、智谱创始愿景者唐杰发布了一封全面的内部信,标志着战略的剧烈调整。信中并未强调商业胜利,而是回归哲学:不断追求基础模型的卓越,作为通向人工通用智能的唯一路径。信中否定了短期商业化的叙事,转而提出2026年的雄心目标,重点在于即将推出的GLM-5,以及三大变革性技术方向——新颖的模型架构、泛化强化学习和持续学习能力。

改写智谱使命的咖啡对话

在香港科技大学实验室咖啡厅,唐杰遇到著名教授杨强,并随意提到:他最近喝咖啡太多了。杨的回应完全改变了对话:“上瘾不一定是坏事。想象一下,如果我们能把对咖啡的上瘾转化为同样强烈的科研动力——难道不能做出非凡的事情吗?”这段简短的对话,浓缩了智谱的哲学基础和杰的世界观。

自2019年正式成立以来,智谱始终遵循一个统一原则——“让机器像人一样思考”。这一灵感源自2018年,唐杰和他的研究团队设计了融合人类认知心理学中双系统理论的机器认知系统,结合快思和慢思范式。然而,尽管自ChatGPT出现以来行业快速发展,唐杰在近期内部讨论中指出:“行业内部仍没有真正的共识;大家都在试错中前行。”

从GLM-130B到SOTA:技术的转折点

智谱的技术路径展现出一种经过深思熟虑的冒险精神,常常挑战行业正统。2020年,当BERT规模模型占据主导时,公司推出了自主研发的GLM架构,并训练了一个100亿参数的基础模型——这一大胆举措吸引了美团等早期采用者。关键是,这一成功距离实现AGI仍有距离,原因在于架构限制:知识库不足,缺乏人类水平的推理能力。

2021-2022年成为关键期。尽管大多数行业参与者将“机器像人一样思考”的愿景视为天方夜谭,智谱却加大投入。公司在指数级扩展的数据集上训练了一个1300亿参数的模型,建立了两个并行创新部门:专注模型训练的GLM研究团队,以及负责构建大模型平台的团队,后者最终支撑bigmodel.cn。到2022年中,GLM-130B在技术上取得突破,赢得全球关注,同时积累了平台的首批生产API用户——这是区别于纯研究机构的关键验证点。

然而,DeepSeek现象重塑了竞争格局。2025年出现的DeepSeek被行业观察者描述为“对中国大型模型企业的冲击波”,尤其影响到智谱,因为其背后有相似的学术研究团队和开源生态贡献。唐杰没有采取防御姿态,而是将竞争压力视为一种启示:“DeepSeek唤醒了我们”,促使公司在技术和商业两个层面进行系统性“强化”。

GLM的融合:智谱如何赶上全球前沿

2025年,智谱在内部设定的战略里程碑上表现得异常精准。4月推出“稳定版”模型(GLM-4.1),年中凭借GLM-4.5赢得“席位”,年底推出GLM-4.7,成为全球基础模型中的Top 1竞争者。根据Artificial Analysis的评估指标,GLM-4.7在国内排名第一,且与Claude 4.5 Sonnet在全球水平上持平。

意外的突破点是编码。当市场陷入价格战和商品化叙事时,智谱识别出代码生成成为差异化的关键切入点。7月推出的GLM-4.5成为决定性节点——技术、平台和商业团队在高强度冲刺中协作。胜利后,GLM-4.6和4.7的迭代巩固了优势:来自184个国家(超过15万用户)的开发者参与了GLM编码计划,带来专业热情和可衡量的采用速度。

收入爆发:MaaS经济验证

商业验证极为有力。仅十个月内,智谱的MaaS平台年化收入从2000万飙升至5亿,增长了25倍,彻底改变了竞争中的投资回报率计算。值得注意的是,海外收入超过2亿,表明非中国市场约占平台经济的40%。这一表现与公众关于中国大型模型经济尚不成熟的叙述形成鲜明对比。

国际布局尤为重要。智谱的“主权AI”计划利用马来西亚的国家级MaaS基础设施,将GLM打造为该国官方大型模型——这是首个中国基础模型技术实现政府合作的案例。唐杰将这一突破归功于国际团队的“勇气与决心”,将海外扩展视为应对北京“让中国AI走向全球部署”号召的战略回应。

杰的2026技术宣言:颠覆既有范式

唐杰的2026年计划不追求渐进优化,而是瞄准基础架构的颠覆。信中提出四大优先方向:

GLM-5发布:通过增强规模和多向技术改进,新一代模型有望实现前所未有的实际任务完成能力,树立新的性能基准。

新颖模型架构探索:Transformer架构——近十年来的主流——在超长上下文计算、记忆机制和更新协议方面逐渐显露局限。智谱致力于发现全新的架构范式,同时推进芯片-算法协同设计优化。

泛化强化学习:当前的RLVR在有限域(数学、代码)表现出色,但在面对无限环境时逐渐暴露结构性局限。2026年的目标是实现能解析和执行长达数小时甚至数天的复杂任务的RL范式,从指令执行迈向真正的自主性。

持续学习与自主演化:现有的生产AI模型在部署后本质上是静态的。它们通过昂贵的一次性训练积累知识,随着现实环境变化逐渐贬值。智谱旨在设计模仿人类神经可塑性的下一代学习范式——在线学习和持续学习框架,实现持续的世界交互和能力积累。

机构创新:X-Lab对颠覆的赌注

认识到组织惯性倾向于渐进优化,智谱成立了名为X-Lab的实验研究部门。该部门通过开放机制招募人才,追求前沿探索,包括新架构、认知范式和项目孵化,不受软件层面限制。与此同时,智谱宣布扩大外部风险投资,超越现有投资组合,明确以生态繁荣为目标,而非零和竞争。

这一制度架构体现了唐杰的哲学信念:“我们不是传统公司,也不打算成为。”相反,智谱追求作为一个AI原生企业的自主涌现——用革命性的可能性取代渐进的习惯,用AI自身优化治理、提升效率、实现系统公平。

哲学尾声:内啡肽胜多巴胺

唐杰在战略信中最后区分了两种奖励机制。IPO带来的满足感是短暂的多巴胺激增——瞬间的兴奋。而真正的满足感来自于沿着通向AGI的道路不断积累的内啡肽:专注、务实、不断向智能的终极边界迈进。其正式表达——达到“终极智能状态”,其中Z代表字母表的终点——彰显了智谱对前沿定位的承诺,而非市场导向。

对行业观察者而言,这一切的意义超越了单一企业战略。智谱的上市和杰的哲学重塑,反映出行业的成熟:持久的竞争优势不再仅仅依赖应用层的优化,而在于基础能力——模型架构的精通、学习范式的创新,以及不断的理论突破。这一承诺是否能转化为持续的技术优势,仍是未知数,但唐杰的决心似乎已然明确:智谱的2026,将决定哲学信念是否与技术可能性相符。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)