La empresa de seguridad BlockSec ha realizado una revisión del estándar de evaluación de auditorías de contratos inteligentes mediante IA llamado EVMBench, desarrollado por OpenAI y Paradigm. Los resultados muestran que los bots de IA son significativamente menos efectivos cuando enfrentan escenarios de explotación reales.
El equipo de investigación amplió el entorno de pruebas con más configuraciones de modelos y añadió incidentes de seguridad recientes, datos que no habían sido vistos en el entrenamiento de los modelos de IA.
Aunque la IA aún no puede reemplazar a los expertos en seguridad, el informe destaca que la inteligencia artificial puede desempeñar un papel complementario natural en el proceso de revisión de código humano.
Los resultados iniciales de EVMBench pueden ser demasiado optimistas
EVMBench evaluó previamente tareas de seguridad en contratos inteligentes como detección, corrección y explotación de vulnerabilidades, con resultados considerados muy impresionantes. Según el informe, la IA puede explotar el 72% y detectar aproximadamente el 45% de las vulnerabilidades, basándose en 120 muestras seleccionadas de auditorías de Code4rena.
Sin embargo, BlockSec sostiene que las condiciones iniciales de las pruebas pudieron haber sesgado los resultados. Yajin Zhou, cofundador, afirmó que al repetir las pruebas con más configuraciones y 22 incidentes de ataque reales, la tasa de éxito en explotación de la IA fue del 0%.
Ampliación de configuraciones y eliminación de “contaminación de datos”
La investigación aumentó el número de configuraciones de modelos de 14 a 26, combinando de manera flexible bots con diferentes “andamios” en lugar de limitarse al ecosistema de cada proveedor. Según el equipo, el método anterior dificultaba distinguir si el rendimiento se debía a la capacidad del modelo o a ventajas arquitectónicas.
Además, BlockSec cuestiona la “contaminación de datos”, ya que EVMBench utilizó vulnerabilidades previamente divulgadas, que podrían haber estado en los datos de entrenamiento de la IA. Para solucionar esto, probaron 22 incidentes de seguridad ocurridos después de febrero de 2026, fuera de la “ventana de conocimiento” de los modelos.
La IA fracasó completamente en explotaciones reales
El resultado más destacado: en 110 pruebas entre agentes y incidentes (5 agentes en 22 situaciones), no hubo ningún caso de explotación completa exitosa. Esto demuestra que incluso las IA más avanzadas aún están lejos de poder realizar ataques en escenarios reales.
Sin embargo, en detección de vulnerabilidades, los resultados siguen siendo relativamente positivos. El modelo Claude Opus 4.6 logró detectar 13 de 20 vulnerabilidades en la práctica.
Las vulnerabilidades comunes y conocidas son fácilmente detectadas por la IA, pero los casos más complejos casi siempre se pasan por alto.

El futuro es la colaboración entre IA y humanos
La investigación concluye que la IA aún no puede reemplazar a los humanos en auditorías de seguridad, y la pregunta más importante es cómo coordinar eficazmente a ambas partes.
La IA tiene ventajas en cobertura y capacidad de escaneo a gran escala, mientras que los humanos sobresalen en análisis profundo, comprensión de protocolos y razonamiento adversarial. Ambos aspectos son complementarios.
Según BlockSec, el camino correcto no es reemplazar a los humanos con IA, sino construir un modelo de colaboración entre ambos para lograr auditorías más completas y efectivas.
Shach Sanh
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Block Inc. divulga tenencias de 28.355 BTC por valor de 2,2 mil millones de dólares en su informe del 1T de prueba de reservas
Mensaje de Gate News, 28 de abril — Block Inc., la empresa fintech liderada por Jack Dorsey y hogar de Square y Cash App, publicó el lunes su primer informe de prueba de reservas del primer trimestre, revelando tenencias totales de bitcoin de 28.355 BTC, con un valor de aproximadamente 2,2 mil millones de dólares al cierre de marzo de 2026. El informe,
GateNewshace1h
Ecosistema Stacks Q1 2026: el TVL de sBTC alcanza 545 millones de dólares, el protocolo Zest sube a 75,9M
Mensaje de Gate News, 28 de abril — Stacks publicó sus datos del ecosistema de Q1 2026. sBTC (el token respaldado por Bitcoin de Stacks) el valor total bloqueado (TVL) alcanzó $545 millones, con los topes de depósitos eliminados por completo. El capital de despliegue activo de finanzas descentralizadas (DeFi) del protocolo Stacks totalizó $121 millones.
Zest
GateNewshace6h
Anza publica una hoja de ruta de seguridad postcuántica para Solana, abordando el cronograma de amenazas cuánticas de 5 años
Mensaje de Gate News, 28 de abril — Anza publicó un documento técnico sobre cómo proteger a Solana de las amenazas de la computación cuántica, con autoría del economista jefe de Anza Max Resnick y del Ph.D. en criptografía aplicada de Stanford Sam Kim. Según investigaciones recientes de Google Quantum y Oratomic, los recursos computacionales necesarios para romper los problemas de logaritmo discreto de curvas elípticas de 256 bits ECDLP-256 han disminuido de forma significativa, y las computadoras cuánticas podrían representar una amenaza práctica dentro de cinco años con una probabilidad del 3-5%.
GateNewshace9h
Galaxy Digital Posts Q1 Results with Negative Earnings Expectations as Crypto Market Faces Headwinds
Gate News message, April 27 — Galaxy Digital (Nasdaq: GLXY) will release its Q1 2026 financial results before market open on Tuesday, April 28, with CEO Mike Novogratz and management hosting a conference call to discuss the results. The investment firm is expected to post weakened Q1 earnings, with
GateNewshace13h
A16z propone un BaaS para la versión de stablecoins ( banca como servicio ), ¿la próxima batalla en los mercados de crédito on-chain?
Informe más reciente de a16z Crypto: el sistema financiero global se está reconstruyendo sobre una nueva infraestructura, y la velocidad de esta transformación podría ser incluso mayor que la que el mundo exterior al sector cripto imagina. Su fuerza impulsora central son las stablecoins. a16z considera que las stablecoins ya no son solo un medio de intercambio usado dentro de las bolsas de criptomonedas, sino que están evolucionando gradualmente hasta convertirse en una nueva capa subyacente de infraestructura para productos financieros globales, y están dando lugar a una nueva modalidad de «banco como servicio» (Banking-as-a-Service,
ChainNewsAbmediahace16h
Perspectivas de Bitcoin ARK 2026: el ETF + DAT representan el 12% de la oferta, estimación de la capitalización del mercado cripto para 2030 de 28 billones
ARK Grandes Ideas 2026 señala que las instituciones han logrado gestionar el 12% de la oferta circulante de BTC mediante la adopción de la aceleración y la fusión de ETF+DAT, y que el gobierno federal y los gobiernos estatales han ido comprando de manera progresiva, formando un soporte a largo plazo. En 2025, el retroceso fue el más bajo de la historia y la volatilidad disminuyó. Para 2030, la capitalización de mercado será de aproximadamente 28 billones de dólares, BTC de aproximadamente 4,2 billones, con un crecimiento anual del 60-61%. Las stablecoins de los mercados emergentes sustituyen parte de la demanda de reservas en BTC; los inversores a largo plazo deberían centrarse en compras estructurales y en la gestión del riesgo.
ChainNewsAbmediahace17h