AI審計が実戦に入り、OpenAIがEVMbenchを発表、スマートコントラクトの安全性評価を強化

ETH0.1%
WELL0.06%

OpenAIとParadigmが協力してEVMbenchを発表、AIエージェントのEVMスマートコントラクトにおける攻防能力を実測し、攻撃の強さと防御の弱さに潜む懸念を明らかに。

経済環境に焦点を当てた実測、OpenAIとParadigmが連携してオンチェーンセキュリティ評価を強化

人工知能のリーディングカンパニーであるOpenAIは、著名な暗号通貨リスク投資企業のParadigmおよびセキュリティ企業のOtterSecと協力し、Ethereum仮想マシン(EVM)スマートコントラクトの安全性評価のためのベンチマークツールEVMbenchを共同開発したことを発表した。

AIと暗号技術の深い融合に伴い、スマートコントラクトは1,000億ドルを超えるオープンソース暗号資産の管理において中核的なインフラとなっている。このツールの登場は、業界がAIの「経済的意義を持つ環境」における実戦能力を真剣に検討し始めたことを象徴している。

OpenAIのチームは、AIエージェントのコード作成・計画能力の飛躍に伴い、今後これらのモデルがブロックチェーンの攻撃と防御の両面で変革をもたらす役割を果たすと指摘している。そのため、標準化された評価フレームワークの構築はAIの進展を監視する上で極めて重要だ。

三つのモードによる深度テスト、120の実際の監査脆弱性がAIの試金石に

EVMbenchの核心設計は、40以上の専門監査レポートから抽出された120の高リスク脆弱性を中心に構築されている。データソースにはCode4renaなどの著名な公開監査コンテストも含まれ、実世界の複雑さに近いテストシナリオを確保している。このベンチマークは、AIエージェントを以下の三つの異なる作業モードに置いて評価を行う。

図:OpenAI EVMbenchの核心設計は、AIエージェントを三つの異なる作業モードに置いて評価すること

  • 一つは「検出モード(Detect)」で、AIにコントラクトコードベースを監査させ、既知の脆弱性を識別し、その問題の深刻度に基づいてスコアを付ける。
  • 二つは「修正モード(Patch)」で、AIに既存の機能を維持しつつ、悪用可能な脆弱性を除去しコードを修復させる。
  • 最後は議論を呼ぶ「エクスプロイトモード(Exploit)」で、AIはサンドボックス化されたブロックチェーン環境内でエンドツーエンドの資金盗難攻撃を実行しなければならない。

テストの厳密性と再現性を確保するため、チームはRust言語を用いたテストフレームワークを開発し、決定論的な取引リプレイ技術を通じてAIの攻撃や修復の成功を検証している。

攻撃と防御のバランスが顕著に現れ、GPT-5.3-Codexの攻撃成長率は驚異的

最初に公開されたテスト結果では、AIは異なるタスク間で明確な能力差を示した。最新のGPT-5.3-Codexはエクスプロイトモードで優れたパフォーマンスを見せ、スコアは72.2%に達した。これは、わずか6ヶ月前にリリースされたGPT-5モデルの31.9%と比べて、非常に著しい成長を示している。

図:OpenAIの各種AIモデルの三つのモードにおけるスコア概要

これは、「資金を枯渇させる」ことを明確な目標とした場合、AIが強力な反復計画と実行能力を持つことを示している。一方、防御側のパフォーマンスは相対的に弱く、検出モードでは単一の誤りを発見した時点で探索を停止しやすく、複雑なロジックの修復においても、コントラクトの正常動作を損なわずに脆弱性を完璧に修復することは難しいとされる。セキュリティ専門家はこれに懸念を示し、AIが脆弱性発見から攻撃手法の開発までの時間を大幅に短縮する可能性を指摘しており、DeFi(分散型金融)プロジェクトの防御速度に対する要求が高まっている。

人材採用と防御支援、OpenAIはAIエージェントエコシステムの安全性を強化

ツール開発に加え、OpenAIは人材配置やエコシステムの防御にも積極的に取り組んでいる。最近では、オープンソースのAIエージェントプロジェクトOpenClawの創設者であるPeter Steinbergerを採用し、次世代のパーソナライズドエージェントの開発を主導、同プロジェクトをOpenAI支援の基金体制に移行させた。

AIがもたらす可能性のあるサイバーセキュリティリスクに対応するため、OpenAIはネットワークセキュリティ支援プログラムを通じて、APIの予算1000万ドルを割り当て、オープンソースの防御ツールや重要インフラの研究を支援することを約束した。この動きは、最近のMoonwellプロトコルの事件後に特に重要性を増している。同事件では、AIによる共同コードの価格計算ミスにより約178万ドルの損失が発生した。

関連情報
Metaの数十億ドルの誘いを断り、OpenClaw創設者がOpenAIに参加、才能争奪戦が激化 Vibe Codingの誤り?Moonwellの予言機の不具合で178万ドルの損失、誰が弁償するのか

今後、より多くのAI支援によるステーブルコイン決済エージェントや自動化されたウォレットがエコシステムに加わるにつれ、EVMbenchのようなツールを用いて、単に脆弱性を記述できるモデルと、信頼できる防御策を提供できるモデルとを区別することが、ブロックチェーンセキュリティ業界の重要な転換点となるだろう。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Flare がプロトコルレベルの MEV 捕捉提案を提出し、FLR の年次インフレ率は 5% から 3% に低下します

Flareは4月10日に統治提案を公表し、新たなエンティティFIREを設立して最大抽出可能価値(MEV)をプロトコル層へ取り込む計画と、FLRトークンの買い戻しとバーンを行うことを予定しています。提案には、ブロック構築の再構築を行う3段階と、FLRの年次インフレ率および年次ハードキャップの引き下げが含まれており、ネットワークの経済モデルを最適化し、プロトコルの透明性と安全性を高めることを目的としています。

GateNews21分前

ビットコイン開発者、量子耐性ウォレット救済プロトタイプを公開

Lightning LabsのCTOであるOlaoluwa Osuntokunによる新しいプロトタイプは、量子の脅威によって抜本的なネットワーク変更が余儀なくされた場合に、ビットコイン利用者が資金を取り戻すのに役立つ可能性があります。このツールは、提案されている緊急アップグレードにおける重要なリスクに対処します。 要点: Lightning LabsのCTOであるOlaoluwa Osuntokunが、bitcoiを保護するためのプロトタイプを構築

Coinpedia1時間前

AethirがATHトークンのクロスチェーンブリッジ攻撃を首尾よく阻止し、ユーザーの損失は9万ドル未満

Aethirは4月10日にセキュリティ情報を公開し、ATHトークンのクロスチェーンブリッジ・コントラクトに対する悪意ある攻撃を首尾よく阻止できたことを確認した。損失は90,000ドル未満だった。影響を受けたすべてのコントラクトは切断済みであり、コアの供給量はそのまま維持されている。Aethirは取引プラットフォームおよび捜査当局と連携し、資金の凍結と攻撃者の追跡を推進し、Discordコミュニティで調査の進捗と補償の案内を公開する。

GateNews2時間前

Telegram傘下のTON取引が1秒を突破、Pavel Durovが7段階の強化計画を発表

Telegram の創業者 Pavel Durov は、TON ブロックチェーンがアップグレード後に取引の確認時間がア秒レベルまで短縮されたと発表し、全体の速度は 10 倍に向上し、ブロック生成頻度は 6 倍に増加しました。Durov は 7 段階のアップグレード計画(MTONGA)を提案しており、ア秒での確認を完了して取引手数料を 6 倍引き下げる計画で、今後のステップではネットワーク性能とエコノミー(生態系経済)を強化していく予定です。今回のアップグレードは、より多くの検証者を惹きつけ、分散化と安全性を高めるでしょう。

MarketWhisper3時間前

Circleは、決済を簡素化するマネージドサービスを発表

Circleは、ステーブルコインの導入を簡素化し、技術面およびコンプライアンス上の障壁を低減するためにマネージドサービスを導入します。 CPNマネージド・ペイメンツにより、単一のAPI統合モデルを通じてUSDCの決済にフィアットネイティブでアクセスできます。 より迅速な決済に対する需要の高まりが導入を後押しし、ステーブルコイン

CryptoFrontNews3時間前

カルダノの創業者:AIは魔法だ - U.Today

カルダノの創設者チャールズ・ホスキンソンは、AIとブロックチェーンの相乗効果を強調し、コンテンツ作成のためのAIボットを発表する。カルダノの開発者グループは成長に焦点を移し、チェーン抽象化を優先するためにアクロポリスの開発を中断しつつ、予定されている次期ハードフォークのアップグレードにおけるパフォーマンス問題にも対処している。

UToday3時間前
コメント
0/400
コメントなし