De acuerdo con la divulgación reciente de Cursor, la empresa presentó una técnica de entrenamiento llamada autoinstall para su serie de modelos Composer: usar un modelo de generación anterior para configurar automáticamente entornos ejecutables para el aprendizaje por refuerzo de la siguiente generación. Al entrenar Composer 2, Cursor usó Composer 1.5 para completar esta tarea. El método funciona en dos pasos: primero, un agente lee la documentación y la configuración del repositorio de código para generar 10 comandos de verificación con salidas esperadas; segundo, otro agente usa 3 de estos comandos para configurar el entorno desde cero hasta que los comandos se ejecuten correctamente, con un máximo de 5 intentos de reintento. Composer 2 logró una puntuación del 61,7% en Terminal-Bench, un benchmark que mide la capacidad de configuración del entorno, frente al 47,9% de Composer 1.5, lo que supone una mejora de 14 puntos porcentuales.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Helsing apunta a recaudar financiación con una valoración de 18 mil millones de dólares
Según Financial Times, Helsing, una startup alemana de drones impulsados por IA, planea recaudar nueva financiación con una valoración aproximada de 18 mil millones de dólares.
GateNewsHace32m
El co-matemático con IA de Google DeepMind logra un 47,9% en FrontierMath Tier 4, supera a GPT-5.5 Pro y resuelve 3 problemas previamente insolubles
Google DeepMind lanzó AI co-matemático, un asistente de investigación matemática multiagente, logrando 47,9% de precisión en el benchmark FrontierMath Tier 4, superando el récord previo de 39,6% de GPT-5.5 Pro del 9 de mayo. El sistema resolvió 23 de 48 problemas, incluidos 3 que todos los modelos anteriores no lograron resolver. Construido sobre Gemini 3.1 Pro, la arquitectura utiliza un diseño jerárquico con un agente coordinador de proyectos que distribuye tareas a subagentes encargados de re
GateNewsHace40m
El sistema de recompensas de OpenAI puntúa inadvertidamente cadenas de pensamiento en 6 modelos, incluido GPT-5.4
Según el equipo de alineación de OpenAI, la empresa descubrió recientemente un error crítico de entrenamiento que afecta a 6 modelos grandes de lenguaje, incluido GPT-5.4. Pensamiento: el mecanismo de recompensa puntuó inadvertidamente las cadenas de pensamiento del modelo, el proceso de razonamiento interno antes de generar respuestas. GPT-5.5 no se vio afectado. El incidente infringe un principio fundamental de seguridad de la IA de que las cadenas de pensamiento nunca deben evaluarse, ya que
GateNewshace2h
Alibaba no negoció con DeepSeek, aclaran fuentes del mercado el 9 de mayo
Según fuentes del mercado reportadas por Caixin Daily el 9 de mayo, Alibaba no realizó negociaciones con DeepSeek sobre financiación. Esta aclaración se produce después de informes mediáticos anteriores que sugerían que las conversaciones entre ambas empresas se habían roto. DeepSeek lanzó una ronda de recaudación de fondos significativa en abril que atrajo el interés tanto de Tencent como de Alibaba.
GateNewshace2h
OpenAI lanza una herramienta de migración de Codex para importar configuraciones desde asistentes de IA competidores
Según OneMillionAI (Beating), OpenAI ha lanzado una herramienta de migración dentro de Codex que permite a los usuarios importar configuraciones y datos de otros asistentes de codificación con IA, incluido Claude Code. La herramienta, anunciada a través de la cuenta oficial de Twitter de OpenAI, transfiere automáticamente prompts del sistema, skills personalizadas, historial de chat de 30 días, configuraciones de servidores MCP, hooks y ajustes de sub-agentes. OpenAI señaló que la herramienta de
GateNewshace2h
ByteDance incrementa el gasto en infraestructura de IA en un 25% hasta 200 mil millones de yuanes el 9 de mayo
Según reportes de medios, ByteDance incrementó su gasto planificado en infraestructura de IA en un 25% hasta 200 mil millones de yuanes en 2026, ya que la empresa acelera el despliegue de inteligencia artificial en medio de la subida de los chips de memoria
GateNewshace3h