Können KI-Agenten die Sicherheit von Ethereum verbessern? OpenAI und Paradigm haben eine Testumgebung geschaffen

ETH1,28%

Kurzfassung

  • EVMbench testet KI-Agenten auf 120 reale Ethereum-Smart-Contract-Schwachstellen.
  • Das Tool bewertet Erkennung, Behebung und Ausnutzung in drei unterschiedlichen Modi.
  • GPT-5.3-Codex erreichte eine Erfolgsquote von 72,2 % im Exploit-Modus.

Der ChatGPT-Hersteller OpenAI und die auf Kryptowährungen fokussierte Investmentfirma Paradigm haben EVMbench vorgestellt, ein Tool zur Verbesserung der Sicherheit von Ethereum Virtual Machine (EVM)-Smart-Contracts.
EVMbench ist entwickelt worden, um die Fähigkeit von KI-Agenten zu bewerten, hochgradige Schwachstellen in EVM-Smart-Contracts zu erkennen, zu beheben und auszunutzen.
Smart Contracts sind das Herzstück des Ethereum-Netzwerks und enthalten den Code, der alles von dezentralen Finanzprotokollen bis hin zu Token-Starts antreibt. Laut Token Terminal erreichte die wöchentliche Anzahl der auf Ethereum bereitgestellten Smart Contracts im November 2025 einen Rekordwert von 1,7 Millionen, wobei allein in der letzten Woche 669.500 Deployments stattfanden.

EVMbench basiert auf 120 ausgewählten Schwachstellen aus 40 Audits, die größtenteils aus offenen Audit-Wettbewerben wie Code4rena stammen, so ein Blogbeitrag von OpenAI. Es umfasst auch Szenarien aus dem Sicherheits-Audit-Prozess für Tempo, eine speziell für hohe Durchsatzraten und kostengünstige Stablecoin-Zahlungen entwickelte Layer-1-Blockchain von Stripe.
Stripe startete im Dezember das öffentliche Testnetz für Tempo und erklärte damals, dass es mit Input von Visa, Shopify und OpenAI entwickelt werde. Ziel sei es, Tests auf wirtschaftlich relevanten, realen Codebasis durchzuführen, insbesondere im Zuge der Expansion KI-gesteuerter Stablecoin-Zahlungen, so das Unternehmen.

Einführung von EVMbench – einem neuen Benchmark, der misst, wie gut KI-Agenten hochgradige Schwachstellen in Smart Contracts erkennen, ausnutzen und beheben können. https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 18. Februar 2026

EVMbench soll KI-Modelle in drei Modi bewerten: Erkennen, Beheben und Ausnutzen. Im „Erkennen“-Modus prüfen Agenten Repositories auf bekannte Schwachstellen und werden anhand ihrer Trefferquote bewertet. Im „Beheben“-Modus müssen Agenten Schwachstellen eliminieren, ohne die beabsichtigte Funktionalität zu zerstören. Im letzten Schritt, dem „Ausnutzen“-Modus, versuchen die Agenten, End-to-End-Angriffe zum Abziehen von Geldern in einer sandboxed Blockchain-Umgebung durchzuführen, wobei die Bewertung durch deterministische Transaktionswiedergabe erfolgt.

Im Exploit-Modus erreichte GPT-5.3-Codex, das über OpenAI’s Codex CLI läuft, eine Punktzahl von 72,2 %, verglichen mit 31,9 % für GPT-5, das vor sechs Monaten veröffentlicht wurde. Die Leistung bei den Erkennungs- und Behebungsaufgaben war schwächer, da die Agenten manchmal nicht gründlich genug auditierten oder Schwierigkeiten hatten, die vollständige Funktionalität des Vertrags zu bewahren.

Die Forscher von OpenAI warnten, dass EVMbench die reale Sicherheitskomplexität nicht vollständig abbildet. Dennoch betonten sie, dass die Messung der KI-Leistung in wirtschaftlich relevanten Umgebungen entscheidend sei, da Modelle immer mächtigere Werkzeuge für Angreifer und Verteidiger werden.

Sam Altman von OpenAI und Ethereum-Mitbegründer Vitalik Buterin standen zuvor wegen des Tempos der KI-Entwicklung im Konflikt.
Im Januar 2025 sagte Altman, sein Unternehmen sei „zuversichtlich, dass wir wissen, wie man eine AGI baut, wie wir sie traditionell verstanden haben.“ Buterin plädierte hingegen dafür, dass KI-Systeme eine „weiche Pause“-Funktion enthalten sollten, die vorübergehend industrielle KI-Operationen einschränken kann, falls Warnzeichen auftreten.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Mysteriöser Wal schließt Kauf von 14.425 ETH für 30,72 Mio. USDT ab

Gate News bot Nachricht, nach Onchain Lens hat der mysteriöse Wal alle $30,72M USDT eingesetzt, um 14.425 ETH zu $2.130 pro Token zu kaufen. Der Wal hält jetzt insgesamt 117.814 ETH im Wert von $251,6M. Zuvor erwarb derselbe Wal 3.618 ETH für $7,7M USDT und baute damit eine frühere Position auf

GateNews2M her

Erik Voorhees assoziierte Adressen haben in den letzten etwa 50 Minuten 5805 ETH erhöht, im Wert von 12,34 Millionen Dollar

Am 20. März überwachte ein On-Chain-Analyst, dass Gründer von ShapeShift Erik Voorhees innerhalb von 50 Minuten 5.805,51 ETH kaufte, mit Gesamtausgaben von etwa 12,344 Millionen US-Dollar. Seine Beteiligungen stiegen auf 109.194,73 ETH, mit einem aktuellen Gesamtwert von etwa 232 Millionen US-Dollar.

GateNews41M her

Geheimniswal erwirbt 3.618 ETH für 7,7 Millionen USDT

Gate News bot message, Der mysteriöse Wal hat 3,618 $ETH für $7.7M $USDT gekauft. Der mysteriöse Wal hält nun 107,007 $ETH im Wert von $229.12M und hält weiterhin $23M $USDT.

GateNews1Std her

Grayscale hat 3979 ETH an eine bestimmte CEX transferiert, im Wert von 8,52 Millionen US-Dollar

Gate News Nachricht: Am 20. März überwachte Arkham, dass Grayscale gerade über seinen Ethereum Mini Trust insgesamt 3979 ETH an eine bestimmte CEX Prime-Adresse transferiert hat, im Wert von etwa 8,52 Millionen Dollar.

GateNews2Std her

Ethereum Kurz vor dem Tiefpunkt? Tom Lee signalisiert Marktwendung

Tom Lee glaubt, dass Ethereum einen Boden erreicht hat, und führt historische Korrelationen und einen erheblichen Abschlag zum realisierten Preis an, trotz Skepsis von einigen Nutzern. Der aktuelle Preis von Ethereum liegt über 50% unter seinem 52-Wochen-Hoch, mit Erholungspotenzial.

TheNewsCrypto3Std her
Kommentieren
0/400
Keine Kommentare