Un error humano interno ha llevado a la exposición del nuevo modelo insignia de Anthropic, codificado como “Claude Mythos”. La compañía lo describe como un “salto significativo en la efectividad de la IA”, al tiempo que advierte que sus capacidades de ciberseguridad superan con creces cualquier modelo de IA existente.
(Resumen: un juez apoya a Anthropic y prohíbe al Departamento de Defensa de EE. UU. castigar a Claude con la “etiqueta de riesgo de cadena de suministro”)
(Información adicional: Informe de índice económico de Anthropic AI: la frecuencia de flujos de trabajo de trading automatizados se ha duplicado, Claude está pasando de ser una herramienta a un asistente personal)
Índice del artículo
Toggle
¿No se trató de una publicación intencionada, sino de un error humano? Según un informe exclusivo de Fortune, Anthropic expuso casi 3,000 artículos internos no publicados en una base de datos de búsqueda pública debido a un error en su sistema de gestión de contenido (CMS).
Fortune obtuvo y revisó algunos de los borradores de los artículos de blog, descubriendo que Anthropic está desarrollando un nuevo modelo insignia codificado como “Claude Mythos” (también conocido como Capybara), y ya lo ha abierto en silencio para pruebas a clientes de acceso temprano.
El borrador dice directamente:
Este es “sin duda el modelo de IA más potente que hemos desarrollado hasta ahora”
Desde una perspectiva de arquitectura, Claude Mythos no es una actualización de Opus, sino que añade un nuevo nivel “Capybara” sobre el nivel existente: reemplazando a Opus como el modelo más avanzado de Anthropic. El archivo borrador señala que, en comparación con Claude Opus 4.6, el nuevo modelo presenta mejoras significativas en programación de software, razonamiento académico y pruebas de ciberseguridad.
Claude actualmente se divide en tres niveles: Haiku (extremadamente barato), Sonnet (balance general) y Opus (insignia reflexiva)
El costo es el gasto computacional. Anthropic admite que este modelo “tiene un alto costo de ejecución”, y no está listo para abrirse al público en general. La estrategia actual es un lanzamiento por etapas: primero, permitir que los socios de acceso temprano lo prueben, y luego decidir si ampliar el despliegue basado en los comentarios recibidos.
La causa de la filtración fue que los permisos predeterminados de los activos del CMS se configuraron como públicos, y los empleados debían marcarlos manualmente como privados; cualquier descuido lo haría directamente buscable. En este incidente, no solo se expuso información del modelo: también se incluyeron archivos de licencia de maternidad de empleados, imágenes no publicadas, PDFs y audio. Fortune notificó a Anthropic, y el acceso fue cerrado de inmediato. Anthropic reconoció que esto fue un “error humano”, y los investigadores Roy Paz de LayerX Security y Alexandre Pauwels de la Universidad de Cambridge también ayudaron a revisar y verificar la autenticidad de los archivos relacionados.
Es notable que el archivo borrador advierte que estos modelos “presagian una ola inminente, donde la capacidad de aprovechar vulnerabilidades superará con creces la velocidad de respuesta de los defensores”. Por esta razón, la estrategia de lanzamiento inicial de Mythos se centra en los defensores cibernéticos, permitiéndoles fortalecer sus bases de código en primer lugar, intentando mantener una ventana de amortiguamiento entre ataque y defensa.
La preocupación oficial no es infundada. Anthropic registró un caso documentado; organizaciones respaldadas por el estado chino ya han utilizado Claude Code para infiltrarse en aproximadamente 30 instituciones, abarcando empresas tecnológicas, instituciones financieras y organismos gubernamentales. Anthropic pasó 10 días investigando el asunto, finalmente prohibiendo las cuentas relacionadas y notificando a las víctimas. Este incidente ocurrió antes de la exposición oficial de Mythos, utilizando herramientas de Claude existentes y no el modelo de próxima generación.
El panorama competitivo también está en movimiento. GPT-5.3-Codex, lanzado simultáneamente por OpenAI, también ha sido clasificado por la industria como un modelo de “alta capacidad” en ciberseguridad, lo que significa que los límites de capacidad de la IA de vanguardia han cruzado colectivamente un nuevo umbral, ya no siendo un problema de un solo proveedor.
Estos archivos filtrados también acompañan una pista sobre la estrategia comercial: Anthropic planea celebrar una cumbre privada de dos días en una mansión del siglo XVIII en el campo inglés, invitando a “los líderes empresariales más influyentes de Europa”, el CEO Dario Amodei asistirá personalmente, y los participantes experimentarán funciones de Claude que aún no se han publicado externamente.
Los detalles de esta cumbre se filtraron inesperadamente, reflejando que Anthropic está acelerando su penetración en el paisaje comercial europeo, y Mythos probablemente será el núcleo de esa presentación privada.