Anthropic 準備 Opus 4.7 和全端 AI 工作室——同時坐擁更可怕的事物

Decrypt · 2026-04-17T15:07:35+00:00

簡要說明 Anthropic 正在準備 Claude Opus 4.7 和一款用於網站和演示的 AI 設計工具 Claude Mythos 仍然是 Anthropic 的真正前沿模型，該公司不會公開發布行業仍然無法可靠地衡量 AI 的改進，這使得關於 Opus 4.7 的聲稱變得困難

Decrypt

2026-04-17 15:07:35

###簡要概述

Anthropic 正在準備 Claude Opus 4.7 以及一款用於網站和演示的 AI 設計工具
Claude Mythos 仍然是 Anthropic 的真正前沿模型，該公司不會公開發布
行業仍無法可靠衡量 AI 的改進，使得關於 Opus 4.7 的提升的聲稱難以驗證

Anthropic 正在準備發布 Claude Opus 4.7 以及一款新的 AI 驅動設計工具，讓用戶可以用簡單的英文提示來建立網站、演示和登陸頁面——據 The Information 報導，這一消息導致 Adobe、Wix 和 Figma 的股價在週一下跌。據一位了解計劃的人士透露，這些產品可能在本週內推出。該設計工具面向開發者和非技術用戶，與 Gamma 和 Google 的 Stitch 等新創公司形成競爭。 Anthropic 未對 Decrypt 的置評請求作出回應。

Opus 4.7 甚至不是 Anthropic 最強大的模型。這一稱號屬於 Claude Mythos——一個專注於網絡安全的強大模型，該公司正悄悄將其交給特定的安全公司，同時將其保持在公開之外。英國的 AI 安全研究所最近評估了 Mythos 預覽版，發現它能自主執行複雜的網絡攻擊，速度遠超其他模型。它成為首個完成“最後的攻擊”——一個 32 步的企業網絡攻擊模擬，通常由人類紅隊花費 20 小時完成的 AI。Mythos 在十次嘗試中成功了三次，平均完成 22/32 步——而 Opus 4.6 的平均為 16 步。這不僅關乎企業安全。衡量 AI 實際能力已成為行業內的頭痛問題。OpenAI 最近稱領先的編碼基準“受到污染”，但模型仍然用這些測試進行比較。另一個 ARC-AGI-3 評估中，Gemini 得分 0.37%，GPT-5.4 達到 0.26%，而人類得分為 100%。這導致一個既有爭議又仍在使用作為證據的基準測試的局面，使得在 Anthropic 發布詳細模型卡之前，難以對 Opus 4.7 的進展作出準確評價。

Opus 和 Mythos 之間的關係比大多數人想像的更為緊密。Anthropic 通過在 Opus 系列的基礎上進行微調來構建其前沿模型——用於公開 Claude 產品的同一骨架被壓力測試並強化成 Mythos。Opus 4.7 是最終被灌輸網絡安全功夫的基礎。此外，Anthropic 的努力越來越偏向開發/企業應用場景。Claude 代碼的泄露、技能系統和 MCP 協議的發布、對代理 AI 的專注以及對編碼基準的重視，都使這一點變得更加明顯。儘管 Anthropic 尚未正式宣布，但這些泄露進一步強化了從 LLM 供應商向類似全棧“AI 工作室”模型轉變的更廣泛趨勢，在這個模型中，Claude 不僅僅是生成文本，而是構建和部署完整的產品。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
GatePreIPOs首發SpaceX
18.96萬熱度
#
Gate13週年現場直擊
65.22萬熱度
#
山寨幣強勢反彈
731.68萬熱度
#
加密市場回升
10.24萬熱度
#
Kalshi與內華達州的監管權爭議
45.86萬熱度

Anthropic 準備 Opus 4.7 和全端 AI 工作室——同時坐擁更可怕的事物

熱門話題

GatePreIPOs首發SpaceX

Gate13週年現場直擊

山寨幣強勢反彈

加密市場回升

Kalshi與內華達州的監管權爭議

置頂