✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
Mythos到底是什么?为什么连Anthropic自己都怕它?
**先说清楚Mythos是什么 —— **它不是一个更强的ChatGPT
Alan 说,他在场的大部分人对 Mythos 的理解是错的,不是因为信息不够,是因为理解框架不对。大家把 Mythos 当成一个更强的 AI 助手,当成 Claude 的升级版。他说,这个理解差了一个数量级。
他接着说了一组数字,现场有人拿出手机开始记。
“这不是 AI 变强了。这是 AI 第一次在安全领域,进入了人类最顶级专家才能进入的维度——然后还比他们快。”
**它为什么没有公开发售——**这个决定本身就是一个信号
Alan 说,Anthropic 的发布策略,是这件事最容易被忽视、也最值得细想的部分。Mythos 是 Anthropic 迄今为止最强的模型,但它没有公开上市。
它只给了十二家机构用,而且只能用于防御目的。
Alan在这里停了一下,把水杯拿起来,然后放下,没喝。
“他们没有公开发售,不是因为它不够好。是因为它太好了,好到他们自己也没有完全想清楚接下来会发生什么。”
**攻击方已经在用了 —— **这不是预测,是记录在案的事实
Alan 说,很多人讨论 Mythos,讨论的是"未来某天坏人拿到这个能力会怎样"。他说,这个讨论的时态已经错了。不是未来,是现在进行时,已经过去时。
“防守联盟拉了十二家公司,承诺一亿美元。这不是一个产品发布的配置。这是一个你知道战争要来了、在最后关头筑防线的配置。”
它在我们看不见的维度里移动
这是 Alan 当天讲的最后一个维度,也是让我回去睡不着的那部分。前面三件事,我多少有心理准备。第四件事让我停了一下。
“真正可怕的不是 Mythos 会被坏人拿去用。是 Mythos 让我们第一次意识到,我们以为安全的东西,在另一个维度上从来就没有安全过。”
修漏洞的速度,永远赶不上找漏洞的速度
Alan 说,很多人听完前面的内容,会有一个自然的安慰:Anthropic 在修,防守联盟在修,那不就好了吗。
他说,这个想法忽略了一个根本性的 不对称,而这个不对称,是整件事里最难解决的结构性问题。
“进攻的速度是 AI 的速度。防守的速度还是人的速度。在这两个速度对齐之前,这中间的空档,是我们所有人都生活在里面的地方。”
Mythos 不是终点,是起点
Alan在最后讲了这件事,也是他讲得最慢的一段。他说,前面讲的所有内容,建立在一个前提上—— Mythos 是现在最强的。
但这个前提,在几个月内就会失效。
“Mythos 是今天我们能看见的边界。它让我们第一次意识到这个边界在哪里。但边界不会停在那里。我们能做的,是在它移动之前,尽量把该修的修好。”
Alan 讲完,把外套拿起来,走了。没有Q&A,没有互动环节,没有分享二维码。
现场沉默了大概十秒。然后有人开始低声说话,但没有人大声说什么。我坐在那里,看着手机上密密麻麻的笔记,发现有一分钟我一个字都没写,只是听着。我回去之后把那份 243 页的 system card 下载下来。我没有全部读完,但我读了 alignment assessment 那一章。Alan 引的那句话在第53页:“we are not confident that we have identified all issues along these lines.”
我们不确定我们已经找出了所有问题。这句话是 Anthropic 写的,关于他们自己造出来的东西。
Alan 今天讲的六件事,每一件单独拿出来,都可以写很长。但串在一起,它们指向同一个结论:这件事的规模、速度和结构性,比大多数人目前理解的要深。不是因为有人在隐瞒,是因为这种程度的变化,人类的直觉本来就不容易自然适应。
Mythos,古希腊语,意为"叙事"——人类理解世界的故事框架。
我想 Anthropic 选这个名字,也许是因为这个模型改变的不只是网络安全,它改变的是我们讲"什么是安全"这个故事的方式。那个故事,需要重新写了。
Palo Alto · 2026年4月
本文引号内为尽量还原的 Alan Walker 原话,非逐字记录
技术数据均来自Anthropic官方文件及Fortune、CNN公开报道
Alan Walker doesn’t use question marks.