前 Tesla AI 总监、OpenAI 创始成员 Andrej Karpathy 于 4 月 9 日在 X 上发表长文,指出公众对 AI 能力的认知正出现严重分裂。他认为,使用免费版 ChatGPT 的人和每天使用 Codex、Claude Code 等前沿 agent 工具的技术人员,实际上是在讨论“完全不同的产品”,但双方都认为自己看到的就是 AI 的全貌。
两个世界,两种 AI 认知
Karpathy 将目前的 AI 使用者分为两个群体。
第一类人在去年某个时间点试用了 ChatGPT 免费版,便以此形成对 AI 的整体印象。他们看到的是模型的各种失误——幻觉、搜索结果离谱、语音模式连“该开车还是走路去洗车”这种简单问题都搞砸。Karpathy 承认这些问题确实存在,但强调免费版与过时模型并不能代表 2026 年前沿 agent 模型的真实能力。
第二类人同时满足两个条件:付费使用最新的前沿 agent 模型(如 OpenAI Codex 或 Claude Code),并且在程序开发、数学、研究等技术领域专业使用。Karpathy 称这群人正经历高度的“AI 精神冲击”(AI Psychosis),因为这些模型在技术领域的近期进步“只能用惊人来形容”——你可以眼睁睁看着它们在一小时内解决原本需要数天甚至数周的程序架构问题。
为何进步集中在技术领域
Karpathy 解释了 AI 能力提升为何在程序开发等技术领域特别显著,而在搜索、写作、建议等一般用途上进步不那么明显。
原因有二:第一,技术领域提供了可验证的奖励函数(例如单元测试是否通过),这让强化学习训练得以有效运作;相比之下,写作品质的优劣难以明确判定。第二,技术领域在 B2B 场景中更具商业价值,因此 AI 公司将最大比例的团队资源投入在这些方向上。
两个群体互相听不懂对方在说什么
Karpathy 总结道,这两个群体正在“各说各话”。OpenAI 免费版语音模式搞砸日常问题,与 OpenAI 最高阶付费版 Codex 花一小时重构整个程序代码库或发现系统漏洞——这两件事同时为真。
他在后续回复中补充,有人向他提出一个观点:OpenClaw 事件之所以引发如此大的社会关注,正是因为它让大量非技术人员首次接触到了最新的 agent 模型,而这些人此前只知道 AI 等于 ChatGPT 网页版。
这篇文章 Karpathy:AI 能力认知出现严重断层,免费版与前沿 Agent 是“完全不同的产品” 最早出现在 链新聞 ABMedia。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
郭明錤:OpenAI 要做 AI Agent 手机,联发科、高通、立讯成关键供应链
郭明錤称 OpenAI 正与联发科、高通、立讯精密合作开发 AI Agent 手机,预计 2028 年量产。新手机将以任务完成为核心,由 AI 代理理解并执行需求,结合云端与装置端运算,重点在感测与情境理解。规格与供应链名单预计 2026–2027 年定案,若成形,或为高端市场带来新换机周期,立讯有望成为主要受益者。
鏈新聞abmedia10 分钟前
小米大模型负责人:AI 竞争转向 Agent 时代,自进化是 AGI 关键事件
小米大模型团队负责人罗福莉于 4 月 24 日在哔哩哔哩平台接受深度访谈(视频号:BV1iVoVBgERD),访谈时长 3.5 小时,为其首次以技术负责人身份公开系统阐述技术观点。罗福莉称,大模型竞争赛道已从 Chat 时代转入 Agent 时代,并指出“自进化”将是未来一年 AGI 关键事件。
Market Whisper52 分钟前
腾讯云 QClaw 接入 Hermes 框架,支持 DeepSeek-V4 Pro 等多模型切换
根据腾讯云于 4 月 27 日官方公告,腾讯云 AI Agent 桌面工具 QClaw 正式发布 v0.2.14 版本,腾讯云表示此次为 QClaw 迄今规模最大的版本升级,核心更新包括接入 Hermes Agent 框架、底层模型升级为自由切换模式,以及“灵感广场”全面升级为“专家广场”。
Market Whisper59 分钟前
xAI Grok Voice 接管 Starlink 客服热线,70% 来电自动结案
根据 xAI 于 4 月 23 日发布官方公告,xAI 推出 Grok Voice Think Fast 1.0 语音 AI 代理人,并已部署于 Starlink 客服热线 +1 (888) GO STARLINK。根据公告披露的实测数据,70% 的来电由 AI 自动结案,无需真人介入。
Market Whisper1小时前
FLOA 生态系统推出 FloaClaw AI 套件,配备多场景技能矩阵
Gate 新闻消息,4月27日——FLOA 生态系统已正式上线 FloaClaw,其核心 AI 工具箱,配备多场景 AI 技能矩阵。FloaClaw 的功能访问权限仅限等级 3 及以上的 Agent 用户。
FloaClaw 采用基于代币的系统,用户购买计算力代币 BNB 支撑 用于消耗 [AI 技能]https://www.gate.com/zh/skills-hub,,消耗将根据任务复杂度进行按比例扩展。平台计划持续扩展新 AI 技能与工具模块。FLOA 还将推出创作者收益分成体系,使 Agent 创作者能够从用户技能消耗中获得一部分计算力代币,并提供一键提取 BNB 支持,以打造可持续的创作者经济。
FLOA 是构建在 BNB Chain 上的智能 Web3 Agent 生态平台,集成数据分析与链上自动化能力,并通过开放的激励机制赋能用户、推动生态增长。
GateNews1小时前
新加坡外交部长在使用 Claude Code 的 Raspberry Pi 上部署定制 AI 助手
Gate News 消息,4 月 27 日——新加坡外交部长 Vivian Balakrishnan 最近宣布,他打造了一个定制的 AI 助手系统,他称之为“外交官的第二大脑”,运行在 Raspberry Pi 5 (一款信用卡大小的微型计算机)上。该系统与他的 WhatsApp 和
GateNews2小时前