Anthropic 準備 Opus 4.7 和全端 AI 工作室——同時坐擁更可怕的事物

###簡要概述

  • Anthropic 正在準備 Claude Opus 4.7 以及一款用於網站和演示的 AI 設計工具
  • Claude Mythos 仍然是 Anthropic 的真正前沿模型,該公司不會公開發布
  • 行業仍無法可靠衡量 AI 的改進,使得關於 Opus 4.7 的提升的聲稱難以驗證

Anthropic 正在準備發布 Claude Opus 4.7 以及一款新的 AI 驅動設計工具,讓用戶可以用簡單的英文提示來建立網站、演示和登陸頁面——據 The Information 報導,這一消息導致 Adobe、Wix 和 Figma 的股價在週一下跌。 據一位了解計劃的人士透露,這些產品可能在本週內推出。該設計工具面向開發者和非技術用戶,與 Gamma 和 Google 的 Stitch 等新創公司形成競爭。 Anthropic 未對 Decrypt 的置評請求作出回應。

Opus 4.7 甚至不是 Anthropic 最強大的模型。這一稱號屬於 Claude Mythos——一個專注於網絡安全的強大模型,該公司正悄悄將其交給特定的安全公司,同時將其保持在公開之外。  英國的 AI 安全研究所最近評估了 Mythos 預覽版,發現它能自主執行複雜的網絡攻擊,速度遠超其他模型。它成為首個完成“最後的攻擊”——一個 32 步的企業網絡攻擊模擬,通常由人類紅隊花費 20 小時完成的 AI。Mythos 在十次嘗試中成功了三次,平均完成 22/32 步——而 Opus 4.6 的平均為 16 步。 這不僅關乎企業安全。衡量 AI 實際能力已成為行業內的頭痛問題。OpenAI 最近稱領先的編碼基準“受到污染”,但模型仍然用這些測試進行比較。另一個 ARC-AGI-3 評估中,Gemini 得分 0.37%,GPT-5.4 達到 0.26%,而人類得分為 100%。這導致一個既有爭議又仍在使用作為證據的基準測試的局面,使得在 Anthropic 發布詳細模型卡之前,難以對 Opus 4.7 的進展作出準確評價。

Opus 和 Mythos 之間的關係比大多數人想像的更為緊密。Anthropic 通過在 Opus 系列的基礎上進行微調來構建其前沿模型——用於公開 Claude 產品的同一骨架被壓力測試並強化成 Mythos。Opus 4.7 是最終被灌輸網絡安全功夫的基礎。 此外,Anthropic 的努力越來越偏向開發/企業應用場景。Claude 代碼的泄露、技能系統和 MCP 協議的發布、對代理 AI 的專注以及對編碼基準的重視,都使這一點變得更加明顯。儘管 Anthropic 尚未正式宣布,但這些泄露進一步強化了從 LLM 供應商向類似全棧“AI 工作室”模型轉變的更廣泛趨勢,在這個模型中,Claude 不僅僅是生成文本,而是構建和部署完整的產品。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言