Gate 廣場|3/5 今日話題: #比特币创下近一月新高
🎁 解讀行情走勢,抽 5 位錦鯉送出 $2,500 仓位體驗券!
隨著白宮表示已向參議院提交凱文·沃什擔任美聯儲主席的提名,美國參議院未通過叫停特朗普打擊伊朗的投票,比特幣於今日凌晨創下 2 月 5 日以來新高,最高觸及 74,050 美元,加密貨幣總市值回升突破 2.538 萬億美元。
💬 本期熱議:
1️⃣ 凱文·沃什的提名是否意味著降息預期升溫?
2️⃣ 當前關口,你是持幣待漲、順勢追多,還是反手布局回調?
分享觀點,瓜分好禮 👉️ https://www.gate.com/post
📅 3/6 15:00 - 3/8 12:00 (UTC+8)
OpenAI 發布了用於評估 AI 代理破解智能合約能力的基準測試 - ForkLog:加密貨幣、人工智能、奇點、未來
OpenAI 與 Paradigm 共同推出了 EVMbench — 一個用於評估 AI 代理識別、修復及利用智能合約漏洞能力的基準測試。
該工具基於從 40 次審計中挑選的 120 個漏洞。大多數範例來自公開的代碼分析平台。它還包括來自 Tempo 區塊鏈安全測試的多個攻擊場景 — 這是一個由 Stripe 和 Paradigm 為高效且低成本的穩定幣支付而開發的專用第一層網路。
與 Tempo 的整合使得基準測試中加入了支付智能合約 — 這是預計「穩定幣」與 AI 代理將積極應用的領域。
為了建立測試環境,OpenAI 改編了現有的漏洞利用工具和腳本,並事先確認其實用性。
EVMbench 評估三種能力模式:
AI 模型的成效
OpenAI 在所有三個模式中測試了先進模型。在 Exploit 類別中,GPT-5.3-Codex 達到 72.2%,GPT-5 達到 31.9%。而在漏洞檢測與修復方面的表現較為謙遜 — 許多問題仍然難以發現與修復。
在 Detect 模式中,AI 代理有時在找到一個漏洞後就停止,而不是進行完整的審計。在 Patch 模式下,它們目前難以修補那些不明顯的問題,同時保持合約的完整功能。
提醒一下,2025 年 11 月,微軟推出了一個用於測試 AI 代理的環境,並揭示了現代數位助手所面臨的漏洞。