
OpenAIとParadigmが協力してEVMbenchを発表、AIエージェントのEVMスマートコントラクトにおける攻防能力を実測し、攻撃の強さと防御の弱さに潜む懸念を明らかに。
経済環境に焦点を当てた実測、OpenAIとParadigmが連携してオンチェーンセキュリティ評価を強化
人工知能のリーディングカンパニーであるOpenAIは、著名な暗号通貨リスク投資企業のParadigmおよびセキュリティ企業のOtterSecと協力し、Ethereum仮想マシン(EVM)スマートコントラクトの安全性評価のためのベンチマークツールEVMbenchを共同開発したことを発表した。
AIと暗号技術の深い融合に伴い、スマートコントラクトは1,000億ドルを超えるオープンソース暗号資産の管理において中核的なインフラとなっている。このツールの登場は、業界がAIの「経済的意義を持つ環境」における実戦能力を真剣に検討し始めたことを象徴している。
OpenAIのチームは、AIエージェントのコード作成・計画能力の飛躍に伴い、今後これらのモデルがブロックチェーンの攻撃と防御の両面で変革をもたらす役割を果たすと指摘している。そのため、標準化された評価フレームワークの構築はAIの進展を監視する上で極めて重要だ。
三つのモードによる深度テスト、120の実際の監査脆弱性がAIの試金石に
EVMbenchの核心設計は、40以上の専門監査レポートから抽出された120の高リスク脆弱性を中心に構築されている。データソースにはCode4renaなどの著名な公開監査コンテストも含まれ、実世界の複雑さに近いテストシナリオを確保している。このベンチマークは、AIエージェントを以下の三つの異なる作業モードに置いて評価を行う。

図:OpenAI EVMbenchの核心設計は、AIエージェントを三つの異なる作業モードに置いて評価すること
- 一つは「検出モード(Detect)」で、AIにコントラクトコードベースを監査させ、既知の脆弱性を識別し、その問題の深刻度に基づいてスコアを付ける。
- 二つは「修正モード(Patch)」で、AIに既存の機能を維持しつつ、悪用可能な脆弱性を除去しコードを修復させる。
- 最後は議論を呼ぶ「エクスプロイトモード(Exploit)」で、AIはサンドボックス化されたブロックチェーン環境内でエンドツーエンドの資金盗難攻撃を実行しなければならない。
テストの厳密性と再現性を確保するため、チームはRust言語を用いたテストフレームワークを開発し、決定論的な取引リプレイ技術を通じてAIの攻撃や修復の成功を検証している。
攻撃と防御のバランスが顕著に現れ、GPT-5.3-Codexの攻撃成長率は驚異的
最初に公開されたテスト結果では、AIは異なるタスク間で明確な能力差を示した。最新のGPT-5.3-Codexはエクスプロイトモードで優れたパフォーマンスを見せ、スコアは72.2%に達した。これは、わずか6ヶ月前にリリースされたGPT-5モデルの31.9%と比べて、非常に著しい成長を示している。

図:OpenAIの各種AIモデルの三つのモードにおけるスコア概要
これは、「資金を枯渇させる」ことを明確な目標とした場合、AIが強力な反復計画と実行能力を持つことを示している。一方、防御側のパフォーマンスは相対的に弱く、検出モードでは単一の誤りを発見した時点で探索を停止しやすく、複雑なロジックの修復においても、コントラクトの正常動作を損なわずに脆弱性を完璧に修復することは難しいとされる。セキュリティ専門家はこれに懸念を示し、AIが脆弱性発見から攻撃手法の開発までの時間を大幅に短縮する可能性を指摘しており、DeFi(分散型金融)プロジェクトの防御速度に対する要求が高まっている。
人材採用と防御支援、OpenAIはAIエージェントエコシステムの安全性を強化
ツール開発に加え、OpenAIは人材配置やエコシステムの防御にも積極的に取り組んでいる。最近では、オープンソースのAIエージェントプロジェクトOpenClawの創設者であるPeter Steinbergerを採用し、次世代のパーソナライズドエージェントの開発を主導、同プロジェクトをOpenAI支援の基金体制に移行させた。
AIがもたらす可能性のあるサイバーセキュリティリスクに対応するため、OpenAIはネットワークセキュリティ支援プログラムを通じて、APIの予算1000万ドルを割り当て、オープンソースの防御ツールや重要インフラの研究を支援することを約束した。この動きは、最近のMoonwellプロトコルの事件後に特に重要性を増している。同事件では、AIによる共同コードの価格計算ミスにより約178万ドルの損失が発生した。
関連情報
Metaの数十億ドルの誘いを断り、OpenClaw創設者がOpenAIに参加、才能争奪戦が激化 Vibe Codingの誤り?Moonwellの予言機の不具合で178万ドルの損失、誰が弁償するのか
今後、より多くのAI支援によるステーブルコイン決済エージェントや自動化されたウォレットがエコシステムに加わるにつれ、EVMbenchのようなツールを用いて、単に脆弱性を記述できるモデルと、信頼できる防御策を提供できるモデルとを区別することが、ブロックチェーンセキュリティ業界の重要な転換点となるだろう。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
CFTCがゴーサイン!Phantomウォレットが「ノーアクション・リリーフ」を受け、規制に準拠したデリバティブ取引の統合が許可される
米国CFTCは暗号資産ウォレット開発企業Phantomに対し、不行動免除を発行し、規制対象のデリバティブ取引インターフェースを登録不要で統合できるようにしました。この免除には、リスクと利益相反の開示など、三つの主要なコンプライアンス要件が付随しており、DeFiと伝統的市場の境界線が徐々に曖昧になる中、非カストディアルウォレットの規制の明確化にとって重要な意義を持っています。
動區BlockTempo1時間前
AIはもはやテクノロジー大手だけのものではない!TetherがQVACを発表し、誰もがLLMを持つ時代が到来した?
Tetherは、AI基盤インフラストラクチャのQVAC Fabricを発表し、クロスプラットフォームに対応した世界初のBitNet LoRA微調整フレームワークを導入しました。これにより、大規模言語モデルを消費者向けハードウェア上で訓練できるようになりました。この技術により、スマートフォンなどのデバイスでモデルの微調整が可能となり、AI開発のコストを大幅に削減し、AIの分散化を促進します。将来的には、いつでもどこでもAIを利用できるようになるでしょう。
ChainNewsAbmedia3時間前
HSBC とスタンダードチャータード、香港ステーブルコイン ライセンス獲得に近づく
香港の規制当局は36件のステーブルコイン ライセンス申請を受け取りましたが、少数の発行者のみを承認する計画です。
HSBCとスタンダードチャータードは、最初のライセンス取得済みHKDステーブルコイン発行者の中に含まれると予想されています。
ライセンスフレームワークは、ステーブルコインをテストするために2024年に開始されたサンドボックスプログラムに基づいています。
CryptoFrontNews3時間前
Bitcoin Layer 2 Network Stacks Completes SIP-034 Upgrade, Network Processing Capacity Increased Up to 30x
Bitcoin Layer 2 network Stacks implemented the SIP-034 upgrade on March 17, enhancing the network processing capacity for certain DeFi applications by up to 30 times. By optimizing transaction processing limits, this upgrade has a significant impact on complex DeFi applications and is expected to indirectly increase transactions and fees.
GateNews3時間前
World は特定の CEX x402 プロトコル向けに AgentKit をローンチし、AI エージェント認証をサポート
World project launches AgentKit, a developer toolkit under CEX's intelligent agent payment protocol x402, enabling AI agents to prove real identity while protecting privacy through World verification authorization. This initiative combines payment and identity mechanisms to build a complete trust system.
GateNews3時間前
DAO インフラストラクチャプロバイダー Tally が運営停止を発表
DAOインフラストラクチャ提供企業のTallyは、米国の規制環境の変化により分散型ガバナンスの需要が減少したことを理由に、運営を停止することを発表しました。最高経営責任者は、以前は厳しい規制がプロジェクトにDAO方式の採用を促していたが、現在の緩やかな環境ではそれが必要な選択肢ではなくなったと述べています。
GateNews4時間前