
OpenAI em parceria com Paradigm lança EVMbench, avaliando na prática a capacidade de ataque e defesa de agentes de IA em contratos EVM, revelando vulnerabilidades e pontos fracos.
Focando em testes no ambiente econômico real, OpenAI e Paradigm reforçam a avaliação de segurança na blockchain
Líder em inteligência artificial, OpenAI anunciou uma colaboração com a conhecida empresa de risco de criptomoedas Paradigm e a empresa de segurança OtterSec para lançar o EVMbench, uma ferramenta de benchmark projetada para avaliar o desempenho de agentes de IA na segurança de contratos inteligentes na Ethereum Virtual Machine (EVM).
À medida que IA e tecnologia de criptografia se fundem profundamente, contratos inteligentes tornaram-se a infraestrutura central para gerenciar mais de 1000 bilhões de ativos criptográficos de código aberto. O lançamento desta ferramenta simboliza que a indústria começa a reconhecer a capacidade prática da IA em ambientes com significado econômico.
A equipe da OpenAI destaca que, com o avanço dos agentes de IA na escrita e planejamento de código, esses modelos desempenharão um papel transformador na defesa e ataque na blockchain. Portanto, estabelecer uma estrutura de avaliação padronizada é crucial para monitorar o progresso da IA.
Três modos de teste aprofundados, 120 vulnerabilidades reais de auditoria tornam-se a pedra de toque da IA
O design central do EVMbench gira em torno de 120 vulnerabilidades de alto risco extraídas de 40 relatórios de auditoria especializados, com fontes incluindo competições públicas de auditoria como Code4rena, garantindo que os cenários de teste reflitam a complexidade do mundo real. A ferramenta avalia agentes de IA em três modos de operação diferentes:

Fonte: OpenAI O design central do EVMbench é avaliar os agentes de IA em três modos distintos de operação
- Primeiro, o “Modo de Detecção (Detect)”, onde a IA audita o código do contrato e identifica vulnerabilidades conhecidas, atribuindo uma pontuação com base na gravidade dos problemas encontrados;
- Segundo, o “Modo de Correção (Patch)”, desafiando a IA a remover vulnerabilidades exploráveis e corrigir o código sem alterar funcionalidades existentes;
- Por último, o controverso “Modo de Exploração (Exploit)”, onde a IA deve executar ataques de roubo de fundos de ponta a ponta em um ambiente sandboxed de blockchain.
Para garantir rigor e reprodutibilidade, a equipe desenvolveu uma estrutura de testes baseada em Rust, usando técnicas de replay de transações determinísticas para verificar se os ataques ou correções da IA tiveram sucesso.
Tendência de ataque crescente, GPT-5.3-Codex demonstra crescimento surpreendente em ataques
Nos primeiros resultados divulgados, a IA mostrou diferenças claras de desempenho entre tarefas distintas. A mais recente geração, GPT-5.3-Codex, destacou-se no modo de exploração, atingindo uma pontuação de 72,2%, uma melhora impressionante em relação ao GPT-5, lançado há apenas seis meses, com 31,9%.

Fonte: Visão geral das pontuações de vários modelos de IA da OpenAI nos três modos
Isso demonstra que, quando o objetivo é “esvaziar fundos”, a IA possui forte capacidade de planejamento e execução iterativa. No entanto, seu desempenho na defesa é relativamente fraco, frequentemente parando a busca após detectar um único erro, e tendo dificuldades em corrigir vulnerabilidades complexas sem impactar a operação normal do contrato. Especialistas em segurança expressaram preocupação, alertando que a IA pode reduzir drasticamente o tempo entre a descoberta de vulnerabilidades e o desenvolvimento de ataques, elevando o nível de exigência na defesa de projetos DeFi.
Contratação de talentos e subsídios de defesa, OpenAI fortalece o ecossistema de agentes de IA
Além do desenvolvimento de ferramentas, a OpenAI também atua na contratação de talentos e na defesa do ecossistema, recentemente recrutando Peter Steinberger, fundador do projeto de código aberto de agentes de IA OpenClaw, para liderar o desenvolvimento de agentes personalizados de próxima geração, transformando o projeto em uma fundação apoiada pela OpenAI.
Para enfrentar os riscos de segurança cibernética potencialmente causados pela IA, a OpenAI compromete-se a destinar 10 milhões de dólares de seu programa de subsídios de segurança de rede para apoiar o desenvolvimento de ferramentas de defesa de código aberto e infraestrutura crítica. Essa iniciativa ganhou relevância após o incidente recente na Moonwell, onde um erro de cálculo de preço no código colaborativo de IA resultou em perdas de aproximadamente 1,78 milhões de dólares.
Leitura adicional
Recusando convite de bilhões do Meta, criador do OpenClaw entra na disputa por talentos com a OpenAI; Previsão de falha no oráculo Moonwell, quem pagará pelos 1,78 milhões de prejuízo?
No futuro, à medida que mais agentes de pagamento com suporte de IA para stablecoins e carteiras automáticas entrarem na ecologia, a capacidade de distinguir modelos que apenas descrevem vulnerabilidades daqueles que podem oferecer soluções de defesa confiáveis usando ferramentas como o EVMbench será um ponto de inflexão crucial na segurança da blockchain.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Lido introduz um novo mecanismo de cluster DVT: reduz a barreira de staking ao mesmo tempo que reforça a segurança dos validadores do Ethereum
A Lido está a avançar na atualização do módulo de staking comunitário, introduzindo o mecanismo de "Clusters DVT Identificados" (IDVTC), otimizando a estrutura de staking do Ethereum, reduzindo barreiras de participação e melhorando a segurança e estabilidade da rede. Cada IDVTC é composto por stakers auditados, aproveitando a tecnologia de validadores distribuídos (DVT) para reduzir riscos sistémicos e aumentar o grau de descentralização. Esta funcionalidade será lançada em 2026, demonstrando como a Lido está a reforçar a resiliência do sistema através da otimização arquitetónica, mantendo a sua competitividade.
GateNews2m atrás
Mistral AI lança Leanstral: primeiro Agent de código aberto Lean 4, pode gerar automaticamente provas formalizadas
A Mistral AI lançou Leanstral, um agente de código de código aberto especificamente concebido para verificação formal em Lean 4, capaz de gerar código e provas que podem ser automaticamente validadas. O modelo utiliza uma arquitetura MoE esparsa, com desempenho superior ao de outros modelos de topo, e oferece descarregamento gratuito e chamadas de API.
GateNews24m atrás
WLFI com preço de 530 milhões para investidores de topo, garantindo acesso à equipa principal de Trump
O projeto de finanças descentralizadas World Liberty Financial (WLFI) aprovou com 99% de votos em 14 de março, lançando um framework de privilégios para investidores em três níveis, onde os «super nós» precisam bloquear 50 milhões de tokens WLFI (aproximadamente 5,3 milhões de dólares) por pelo menos 180 dias para obter oportunidades de negociação com executivos da WLFI. O projeto conta com o apoio da família Trump, mas gerou controvérsias devido às associações entre investimentos e política, particularmente investigações sobre investimentos da família real dos Emirados Árabes Unidos.
MarketWhisper31m atrás
Banco Central Russo planeia abrir canal de ativos digitais Ethereum para contornar sanções e atrair investimento estrangeiro
O banco central russo planeia apresentar uma proposta que permita a circulação de ativos financeiros digitais (DFA) em blockchains públicos abertos como Ethereum, a fim de contrariar as sanções ocidentais e atrair investimento estrangeiro. Se o projeto de lei for aprovado em 2026, melhorará a atual estrutura de mercado que depende da procura doméstica e oferecerá novas oportunidades às empresas russas nos mercados de capitais internacionais. No entanto, ainda será necessário ultrapassar obstáculos técnicos e jurídicos.
MarketWhisper57m atrás
Sui lança máquina virtual na fase de testes e abre programa de recompensas por vulnerabilidades
Gate News - Notícia: Em 17 de março, Sui Developers publicou um tweet indicando que a nova máquina virtual Sui está online para testes, com um programa de recompensas por vulnerabilidades simultaneamente aberto. De acordo com a introdução, a nova máquina virtual lançada desta vez inclui três atualizações tecnológicas centrais: reescrita completa do mecanismo de execução, mecanismo de cache mais rápido e atualização da linguagem Move de próxima geração.
GateNews1h atrás
Diretor executivo da Messari renuncia e reduz pessoal, transformando em empresa "focada em IA"
A plataforma de dados blockchain Messari anunciou a demissão do CEO Eric Turner, com o CTO Diran Li assumindo o cargo de CEO, após a realização de cortes de pessoal e a reorganização como uma instituição "focada em IA". Esta transformação visa automatizar processos de pesquisa através de IA, melhorando a eficiência analítica e alinhando-se com a tendência de adopção de IA no mercado de criptografia. Os cortes de pessoal representam um fenómeno generalizado na indústria de criptografia, enfatizando a redução de força de trabalho tradicional e a concentração de recursos no desenvolvimento de IA.
MarketWhisper1h atrás