O Cursor revela o método de treinamento com autoinstalação e melhora o desempenho do Composer 2 em 14 pontos percentuais

De acordo com a divulgação recente da Cursor, a empresa revelou uma técnica de treinamento chamada autoinstall para sua série de modelos Composer: usar um modelo da geração anterior para configurar automaticamente ambientes executáveis para o aprendizado por reforço da próxima geração. Ao treinar o Composer 2, a Cursor usou o Composer 1,5 para concluir essa tarefa. O método funciona em duas etapas: primeiro, um agente lê a documentação e a configuração do repositório de código para gerar 10 comandos de verificação com saídas esperadas; segundo, outro agente usa 3 desses comandos para configurar o ambiente do zero até os comandos serem executados com sucesso, com no máximo 5 tentativas de repetição. O Composer 2 obteve uma pontuação de 61,7% no Terminal-Bench, um benchmark que mede a capacidade de configuração de ambientes, em comparação com os 47,9% do Composer 1,5, registrando uma melhora de 14 pontos percentuais.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Helsing mira captar recursos com avaliação de US$ 18 bilhões

De acordo com o Financial Times, a Helsing, uma startup alemã de drones com IA, planeja captar novo financiamento em uma avaliação de aproximadamente US$ 18 bilhões.

GateNews26m atrás

O co-matemático de IA da Google DeepMind atinge 47,9% no FrontierMath da Categoria 4, supera o GPT-5,5 Pro e resolve 3 problemas previamente insolúveis

O Google DeepMind lançou o AI co-matematician, um assistente de pesquisa em matemática multiagente, alcançando 47,9% de acurácia no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% em 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que nenhum modelo anterior conseguiu resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador do projeto distribuindo tarefas para subagentes encarregados de recuper

GateNews34m atrás

O sistema de recompensas da OpenAI, inadvertidamente, pontua cadeias de raciocínio em 6 modelos, incluindo GPT-5.4

De acordo com a equipe de alinhamento da OpenAI, a empresa recentemente descobriu um erro crítico de treinamento que afetou 6 grandes modelos de linguagem, incluindo o GPT-5.4. Pensamento: o mecanismo de recompensa, por engano, pontuou cadeias de pensamento do modelo — o processo interno de raciocínio antes de gerar respostas. O GPT-5.5 não foi afetado. O incidente viola um princípio fundamental de segurança em IA de que as cadeias de pensamento nunca devem ser avaliadas, pois fazê-lo poderia in

GateNews1h atrás

A Alibaba não realizou negociações com a DeepSeek, esclarecem fontes do mercado em 9 de maio

De acordo com fontes de mercado divulgadas pelo Caixin Daily em 9 de maio, a Alibaba não fez negociações com a DeepSeek sobre financiamento. Este esclarecimento ocorre após reportagens anteriores sugerirem que as conversas entre as duas empresas teriam fracassado. A DeepSeek lançou uma rodada relevante de captação em abril, que atraiu o interesse tanto da Tencent quanto da Alibaba.

GateNews2h atrás

A OpenAI Lança uma Ferramenta de Migração do Codex para Importar Configurações de Assistentes de IA Concorrentes

De acordo com OneMillionAI (Beating), a OpenAI lançou uma ferramenta de migração dentro do Codex que permite aos usuários importar configurações e dados de outros assistentes de programação de IA, incluindo o Claude Code. A ferramenta, anunciada via conta oficial do Twitter da OpenAI, transfere automaticamente prompts do sistema, skills personalizadas, histórico de chats de 30 dias, configurações de servidores MCP, hooks e configurações de subagentes. A OpenAI observou que a ferramenta de migraç

GateNews2h atrás

A ByteDance aumenta os gastos com infraestrutura de IA em 25% para 200 bilhões de iuanes em 9 de maio

De acordo com reportagens da mídia, a ByteDance aumentou em 25% seus gastos planejados com infraestrutura de IA para 200 bilhões de iuan em 2026, à medida que a empresa acelera a implantação de inteligência artificial em meio ao aumento da demanda por chips de memória

GateNews3h atrás
Comentário
0/400
Sem comentários