AIエージェントはイーサリアムのセキュリティを向上させることができるか?OpenAIとParadigmがテスト環境を作成

ETH0.02%

概要

  • EVMbenchは、120の実世界のイーサリアムスマートコントラクトの脆弱性を対象にAIエージェントをテストします。
  • ツールは、検出、修正、悪用の3つの異なるモードで評価を行います。
  • GPT-5.3-Codexは、悪用モードのテストで72.2%の成功率を達成しました。

ChatGPTの開発元であるOpenAIと、暗号通貨に特化した投資会社Paradigmは、イーサリアム仮想マシン(EVM)のスマートコントラクトのセキュリティ向上を目的としたツール、EVMbenchを発表しました。
EVMbenchは、AIエージェントがイーサリアム仮想マシン(EVM)スマートコントラクトの高重大度脆弱性を検出、修正、悪用できる能力を評価するために設計されています。
スマートコントラクトは、分散型金融プロトコルやトークンのローンチなど、イーサリアムネットワークの中心的な役割を担っています。Token Terminalによると、2025年11月にはイーサリアム上に展開されたスマートコントラクトの週次数が史上最高の170万件に達し、先週だけで66万9500件が展開されました。

EVMbenchは、OpenAIのブログ投稿によると、Code4renaなどのオープン監査コンペティションから得られた40の監査から選定された120の脆弱性を基にしています。また、TempoやStripeの高スループット・低コストのステーブルコイン決済に特化したレイヤー1ブロックチェーンのセキュリティ監査のシナリオも含まれています。
決済大手Stripeは、2024年12月にTempoのパブリックテストネットを開始し、その際にVisaやShopify、OpenAIなどの意見を取り入れて構築していると発表しました。
この取り組みの目的は、特にAI駆動のステーブルコイン決済が拡大する中で、実用的なコードに基づいたテストを行うことにあります。

EVMbenchの紹介—AIエージェントが高重大度のスマートコントラクトの脆弱性を検出、悪用、修正できる能力を測定する新しいベンチマークです。https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 2026年2月18日

EVMbenchは、「検出」「修正」「悪用」の3つのモードでAIモデルを評価します。
「検出」モードでは、エージェントがリポジトリを監査し、実際の脆弱性をどれだけ正確に把握できるかでスコア付けされます。
「修正」モードでは、エージェントは意図した機能を損なうことなく脆弱性を排除しなければなりません。
最後に、「悪用」モードでは、エージェントがサンドボックス化されたブロックチェーン環境でエンドツーエンドの資金流出攻撃を試み、決定論的なトランザクションリプレイによって評価されます。
悪用モードでは、OpenAIのCodex CLIを使用したGPT-5.3-Codexが72.2%のスコアを獲得し、6ヶ月前にリリースされたGPT-5の31.9%を上回りました。
検出と修正のタスクでは、エージェントが網羅的に監査できなかったり、コントラクトの完全な機能を維持するのに苦労したりするため、パフォーマンスはやや劣る傾向にあります。

ChatGPTの開発者たちは、EVMbenchは実世界のセキュリティの複雑さを完全には反映していないと警告しています。それでも、モデルが攻撃者と防御者の両方にとって強力なツールとなる中、経済的に重要な環境でのAIのパフォーマンス測定は非常に重要だと付け加えました。
サム・アルトマン率いるOpenAIとイーサリアムの共同創設者ビタリック・ブテリンは、これまでAIの進展速度について意見が対立してきました。
2025年1月、アルトマンは「私たちは従来理解してきた通りにAGIを構築できると自信を持っている」と述べました。一方、ブテリンは、警告サインが現れた場合に一時的に産業規模のAI運用を制限できる「ソフトポーズ」機能を備えるべきだと提言しています。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Bitmineが68億ドルのステーキングされたイーサリアムでMAVANをローンチ

Bitmineは、3.1百万ETH以上がステーキングされた機関向けイーサリアムステーキングのためのMAVANプラットフォームを立ち上げ、年間3億ドルの報酬を目指しています。 このプラットフォームはセキュリティとパフォーマンスに重点を置いており、より多くのプルーフ・オブ・ステークネットワークへの拡大を計画しています。

CryptoFrontNews2時間前

ETHが2000 USDTを突破し、24時間の下落幅が3.07%に縮小しました。

Gate Newsのニュース、3月28日、あるCEXの市場データによると、ETHは2000 USDTを突破し、現在2000.26 USDTを報告しており、24時間の下落幅は3.07%に縮小しています。

GateNews4時間前

Hey AnonはEthereum上で「Pandora」予測市場のローンチを発表しました。

ねえ、AnonはEthereum上に分散型のAI駆動予測市場「Pandora」を立ち上げました。これにより、ユーザーは中央集権的な制御なしに透明な市場を作成できるようになり、プラットフォームには独自のAIコンセンサスメカニズムが備わっており、予測市場の革新を目指しています。

CoinDesk5時間前

昨日、米国のスポットBTC ETFは純流出2億2550万ドル、ETH ETFは純流出4850万ドルでした

Gate News のニュース、3 月 28 日、Farside の監視によると、昨日(3 月 27 日)アメリカの現物ビットコイン ETF は 2.255 億ドルの純流出があり、連続して 2 取引日で純流出を達成した。昨日アメリカの現物イーサリアム ETF は 4850 万ドルの純流出があり、連続して 8 取引日で純流出を達成した。

GateNews6時間前

チェーンはまだあるが、人はいなくなった!イーサリアム10年のベテラン:中間層は全滅し、未来には天と地だけが残る。

イーサリアム開発者の陳品は、過去10年を振り返り、ブロックチェーン産業の中間層が消失したことを指摘し、今後は「信頼できる中立性」またはツール化の2つの極端に進むだろうと述べました。彼は過去の3つの段階の発展を振り返り、未来の理想主義または実用主義の方向性について疑問を呈しました。

CryptoCity6時間前

昨日、米国のスポット・イーサリアムETFは純流出4850万ドルとなり、8営業日連続で純流出となった。

BlockBeatsのニュース、3月28日、Farsideの監視によると、昨日アメリカの現物イーサリアムETFは4850万ドルの純流出を記録し、すでに8営業日連続で純流出を実現しています。

BlockBeatNews6時間前
コメント
0/400
コメントなし