OpenAI 發布 GPT-5.5:更快、更智能——而且更昂貴

###簡要概述

  • GPT-5.5 今日在 ChatGPT 和 Codex 中面向 Plus、Pro、Business 和 Enterprise 用戶推出,API 访问即将上线,收费为每输入令牌 5 美元/百万,每输出令牌 30 美元/百万。
  • 該模型在 Terminal-Bench 2.0 上達到 82.7% 的得分——一個測試複雜命令行工作流程的基準——超越 Claude Opus 4.7 的 69.4% 和 Gemini 3.1 Pro 的 68.5%。
  • GPT-5.5 在完成相同 Codex 任務時,使用的令牌數明顯少於 GPT-5.4,儘管價格較高,但效率更高。

OpenAI 在星期四推出了 GPT-5.5,基本將其定位為一款面向代理性計算機使用的模型。它能撰寫和調試代碼、瀏覽網頁、填寫電子表格,並在多步驟任務中持續工作,無需人類全程監督。 OpenAI 表示,該模型已經開始在 ChatGPT 和 Codex 的 Plus、Pro、Business 和 Enterprise 訂閱用戶中推廣。 “我們推出了 GPT‑5.5,我們迄今為止最智能、最易用的模型,也是邁向一種在電腦上完成工作的全新方式的下一步,”OpenAI 在公告中表示。“在代理性編碼、電腦使用、知識工作和早期科學研究等領域,這些進步尤其顯著——這些領域的進展依賴於跨越上下文的推理和隨時間採取行動。”

介紹 GPT-5.5

一種用於實際工作和驅動代理的新型智能,旨在理解複雜目標、使用工具、檢查工作並完成更多任務。它標誌著一種全新的電腦工作方式。

現已在 ChatGPT 和 Codex 中提供。pic.twitter.com/rPLTk99ZH5

— OpenAI (@OpenAI) 2026年4月23日

OpenAI 的重點新聞:GPT-5.5 明顯比前代 GPT-5.4 更聰明——而且速度不慢。在實際服務中,能與 GPT-5.4 的每令牌延遲保持一致,同時在多個基準測試中取得更高分,這種效率提升通常是不可能的。較大的模型在相同硬件下運行時往往較慢。 在 Terminal-Bench 2.0 上,該測試模型處理需要規劃和反覆工具使用的複雜命令行工作流程的能力,GPT-5.5 得分 82.7%。Claude Opus 4.7 得分 69.4%,而 Gemini 3.1 Pro 為 68.5%。這不是微弱的領先。 在 GDPval 這個測試 44 個真實職業(從金融到法律研究再到產品管理)中的知識工作能力的基準中,GPT-5.5 在 84.9% 的比較中與行業專業人士持平或超越。

圖片:OpenAI

它也是一個相當不錯的程式設計師,正如預期。在 Expert-SWE 這個內部長期編碼任務基準中,GPT-5.5 在人類平均完成時間估計為 20 小時的情況下,表現優於 GPT-5.4。在 SWE-Bench Pro 上,該模型在解決實際 GitHub 問題方面得分達到 58.6%。Claude Opus 4.7 得分較高,為 64.3%,但 OpenAI 表示這可能是因為“Anthropic 在部分問題上報告了記憶化的跡象”。 這次推出正值代理性 AI 熱潮迅速推動市場之際。GPT-5.4 在 GPT-5.3 發布後僅兩天就到來,而小米則在約五週內從 MiMo-V2-Pro 升級到具有完整多模態能力的 MiMo 2.5 Pro。GPT-5.4 和 GPT-5.5 之間的時間差約為七週。這就是現在的節奏。 但這款模型是否會對不經常編寫下一個大項目的普通用戶產生影響?如果你使用免費層,答案是否定的:GPT-5.5 不會提供給免費用戶。如果你付費訂閱 Plus,每月 20 美元,今天就會推出。我們在 Pro 帳戶下測試時,模型尚未立即可用。

更重要的可能是 GPT-5.5 在 Codex 中的表現——OpenAI 的代理性編碼環境——證明它更強大。“我真的覺得我在與一個更高智慧的存在合作,幾乎有一種尊重的感覺,”MagicPath 的 CEO Pietro Schirano 在 OpenAI 分享的一段話中說。 專為更高難度、更高精度工作設計的 GPT-5.5 Pro,將分別在 ChatGPT 中面向 Pro、Business 和 Enterprise 用戶推出。在測試模型在網絡上追蹤難找信息能力的 BrowseComp 中,GPT-5.5 Pro 得分 90.1%,領先 Gemini 3.1 Pro 的 85.9%。 該模型也是基於人工分析指數的平均最智能模型。GPT 5.5 表示在令牌的使用上更高效、更有用,整體產出更佳。

圖片:OpenAI

然而,定價可能會讓一些用戶感到震驚。API 將在推出時收取每百萬輸入令牌 $5 和每百萬輸出令牌 $30 的費用,OpenAI 表示“很快”就會推出。GPT-5.5 Pro 在 API 中的價格將是每百萬輸入令牌 $30 和每百萬輸出令牌 $180 。

這些數字高於 GPT-5.4——每百萬輸入令牌 2.50 美元,每百萬輸出令牌 15.00 美元——而 GPT-5.5 Pro 的定價則與 GPT-5.4 Pro 相同。  不過,OpenAI CEO Sam Altman 在 X 上表示,令牌效率的提升抵消了成本——GPT-5.5 用更少的令牌完成相同的 Codex 任務,即使每個令牌的費用較高,也能實現更便宜的運行。 僅供比較,小米 MiMo v2.5 Pro 每百萬輸入和輸出令牌收費 $1 和 $3 ,Minimax M2.7 分別為 0.30 美元和 1.20 美元,而 Kimi K2.5 每百萬令牌則需 0.44 和 2.00 美元。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言