La auditoría de IA entra en la fase práctica, OpenAI lanza EVMbench, fortaleciendo la evaluación de seguridad de contratos inteligentes

ETH1,44%
WELL-1,33%

OpenAI junto con Paradigm lanzan EVMbench, una evaluación práctica de la capacidad de los agentes de IA en la defensa y ataque de contratos inteligentes en EVM, revelando preocupaciones sobre la fortaleza de los ataques frente a las defensas débiles.

Enfocándose en pruebas en entornos económicos reales, OpenAI y Paradigm fortalecen la evaluación de seguridad en la cadena

El líder en inteligencia artificial, OpenAI, anunció su colaboración con la reconocida firma de inversión en criptomonedas y riesgos, Paradigm, junto con la empresa de seguridad OtterSec, para lanzar EVMbench, una herramienta de referencia diseñada específicamente para evaluar el rendimiento de los agentes de IA (AI Agents) en la seguridad de contratos inteligentes en la máquina virtual de Ethereum (EVM).

Con la integración profunda de IA y tecnología criptográfica, los contratos inteligentes se han convertido en la infraestructura central para gestionar más de 100 mil millones en activos criptográficos de código abierto. La aparición de esta herramienta simboliza que la industria comienza a tomar en serio la capacidad práctica de la IA en entornos con importancia económica.

El equipo de OpenAI señala que, con los avances en la escritura y planificación de código por parte de los agentes de IA, en el futuro estos modelos jugarán un papel transformador en las áreas de ataque y defensa en blockchain, por lo que establecer un marco de evaluación estandarizado será crucial para monitorear el progreso de la IA.

Tres modos de prueba en profundidad, 120 vulnerabilidades reales de auditoría como piedra de toque para la IA

El diseño central de EVMbench gira en torno a 120 vulnerabilidades de alto riesgo extraídas de 40 informes de auditoría especializados, con datos provenientes de competiciones públicas de auditoría como Code4rena, asegurando que los escenarios de prueba reflejen la complejidad del mundo real. La evaluación coloca a los agentes de IA en tres modos de operación diferentes:

Fuente: Diseño central de EVMbench de OpenAI, que evalúa a los agentes de IA en tres modos diferentes

  • El primero es el “Modo de detección (Detect)”, donde la IA audita el código del contrato y detecta vulnerabilidades conocidas, asignando una puntuación según la gravedad de los problemas encontrados;
  • El segundo es el “Modo de reparación (Patch)”, que desafía a la IA a eliminar vulnerabilidades explotables y reparar el código sin alterar las funciones originales;
  • Finalmente, el “Modo de explotación (Exploit)”, en el que la IA debe ejecutar ataques de robo de fondos de extremo a extremo en un entorno de blockchain sandboxed.

Para garantizar la rigurosidad y repetibilidad de las pruebas, el equipo desarrolló una arquitectura de pruebas basada en Rust, utilizando técnicas de reproducción de transacciones deterministas para verificar si los ataques o reparaciones de la IA tienen éxito.

Tendencia de ataque y defensa claramente marcada, GPT-5.3-Codex muestra un crecimiento sorprendente en capacidades de ataque

En los primeros resultados publicados, se observa una diferencia significativa en el rendimiento de la IA en distintas tareas. La última generación, GPT-5.3-Codex, destaca en el modo de explotación (Exploit Mode), con una puntuación de 72.2 %, en comparación con solo 31.9 % de GPT-5, lanzado hace apenas seis meses, demostrando un crecimiento asombroso en sus capacidades.

Fuente: Resumen de puntuaciones de diversos modelos de IA de OpenAI en los tres modos

Esto indica que, cuando el objetivo es “vaciar fondos”, la IA posee una capacidad de planificación y ejecución iterativa muy potente. Sin embargo, en aspectos defensivos, su rendimiento es relativamente débil: en modo de detección, a menudo se detiene tras encontrar un solo error, y al reparar lógica compleja, suele tener dificultades para corregir vulnerabilidades sin afectar la operación normal del contrato. Los expertos en seguridad expresan preocupación, señalando que la IA podría reducir drásticamente el tiempo desde la detección de vulnerabilidades hasta el desarrollo de ataques, lo que exige una mayor velocidad de defensa en proyectos DeFi.

Contratación de talento y subsidios para defensa, OpenAI apuesta por la seguridad del ecosistema de agentes de IA

Además del desarrollo de herramientas, OpenAI también realiza movimientos en la contratación de talento y en la protección del ecosistema. Recientemente, contrató a Peter Steinberger, fundador del proyecto de código abierto de agentes de IA OpenClaw, para liderar el desarrollo de la próxima generación de agentes personalizados, transformando dicho proyecto en un fondo de apoyo respaldado por OpenAI.

Para hacer frente a los riesgos de ciberseguridad que la IA podría traer, OpenAI se compromete a destinar 10 millones de dólares en subsidios a través de su programa de apoyo en seguridad de redes, para apoyar investigaciones en herramientas de defensa de código abierto y en infraestructura crítica. Esta iniciativa resulta especialmente oportuna tras el reciente incidente con el protocolo Moonwell, donde un error en el código compartido por IA provocó pérdidas por aproximadamente 1.78 millones de dólares.

Lecturas relacionadas
Rechazo a la oferta de Meta por miles de millones, creadores de OpenClaw se unen a la competencia por talento con OpenAI, ¿todo por Vibe Coding? Predicción fallida de Moonwell, ¿quién pagará los 1.78 millones en pérdidas?

De cara al futuro, a medida que más agentes de pago con stablecoins asistidos por IA y billeteras automáticas se integren en el ecosistema, la capacidad de herramientas como EVMbench para distinguir entre modelos que solo describen vulnerabilidades y aquellos que pueden ofrecer soluciones de defensa confiables será un punto de inflexión clave en la seguridad blockchain.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Tether lanza el primer «marco de entrenamiento de IA a nivel de mil millones» para dispositivos móviles a nivel mundial, compatible con iPhone y Samsung para ejecutar LoRA

La división QVAC de Tether lanzó el primer marco de microajuste LoRA que admite la arquitectura BitNet de Microsoft a nivel mundial el 17 de marzo, reduciendo significativamente los requisitos de memoria y computación de los modelos IA, permitiendo el entrenamiento localizado en teléfonos móviles. Esta tecnología permite a los usuarios realizar aprendizaje personalizado sin cargar datos, protegiendo la privacidad. Las pruebas muestran que los teléfonos modernos pueden realizar microajustes efectivos de modelos con parámetros de mil millones, impulsando el potencial de aplicación de la computación perimetral.

動區BlockTempoHace46m

Aster Mainnet se lanza en vivo con el lanzamiento del explorador de bloques

Mensaje del bot Gate News, Aster ha lanzado su mainnet. Un explorador de bloques ahora está disponible en su sitio web. La posición $ASTER long más grande en Hyperliquid tiene 25.93M $ASTER valorados en $20.4M, actualmente arriba $3.9M.

GateNewsHace48m

Arbitrum publica informe de transparencia de 2025: volumen acumulado de transacciones superior a 2.100 millones, valor total bloqueado de aproximadamente 20.000 millones de dólares

La Fundación Arbitrum publicó el informe de transparencia 2025, que muestra que las instituciones financieras tradicionales están acelerando su despliegue de negocios en la cadena, con 189 proyectos de colaboración en el ecosistema, un volumen de transacciones que supera los 21 mil millones, un valor total bloqueado de aproximadamente 20 mil millones de dólares y una escala de RWA en la cadena que supera los 800 millones de dólares. Al mismo tiempo, se impulsa la actualización de infraestructura y la expansión de ingresos.

GateNewsHace50m

La plataforma de tokenización Theo lanza la stablecoin de rendimiento vinculada al oro thUSD

Gate News reporta que el 17 de marzo, la plataforma de tokenización Theo anunció el lanzamiento de thUSD, una stablecoin generadora de rendimientos vinculada al oro, con un fondo disponible de hasta 100 millones de dólares. Esta stablecoin está respaldada por thGOLD, su token de oro emitido, y genera rendimientos a través de una estrategia de arbitraje en efectivo que implica mantener una posición larga en oro físico mientras se vende en corto futuros de oro. Anteriormente, Theo había recaudado 15.5 millones de dólares en financiación liderada por Hack VC y Anthos Capital.

GateNewsHace50m

Sharplink obtuvo 493 ETH en recompensas de staking la semana pasada, con recompensas de staking acumuladas de 15,464 ETH

Gate News informa que, el 17 de marzo, Sharplink anunció que desde el inicio de su bóveda de Ethereum, ha obtenido un total de 15,464 ETH en ingresos por staking, lo que equivale aproximadamente a 36 millones de dólares a los precios actuales. Sharplink indicó que la semana pasada obtuvo más de 493 ETH a través del staking, con unos ingresos de aproximadamente 1,1 millones de dólares. El proyecto afirmó que el ETH que posee seguirá generando más ETH mediante staking.

GateNewsHace56m

Ripple amplía sus operaciones de activos digitales en Brasil, planea solicitar licencia de proveedor de servicios de activos virtuales

Ripple anunció que expandirá sus servicios de activos digitales en Brasil, planea solicitar una licencia de proveedor de servicios de activos virtuales e integrado la red con múltiples instituciones locales, incluidos Banco Genial y Braza Bank, para promover transferencias en dólares e emisión de monedas estables.

GateNewshace1h
Comentar
0/400
Sin comentarios