O Cursor revela um método de treino de autoinstalação e melhora o desempenho do Composer 2 em 14 pontos percentuais

De acordo com a divulgação recente da Cursor, a empresa apresentou uma técnica de treino chamada autoinstall para a série de modelos Composer: usar um modelo de geração anterior para configurar automaticamente os ambientes executáveis para a aprendizagem por reforço da próxima geração. Ao treinar o Composer 2, a Cursor utilizou o Composer 1.5 para completar esta tarefa. O método funciona em dois passos: primeiro, um agente lê a documentação e a configuração do repositório de código para gerar 10 comandos de verificação com resultados esperados; segundo, outro agente usa 3 desses comandos para configurar o ambiente de raiz até que os comandos sejam executados com sucesso, com um máximo de 5 tentativas de repetição. O Composer 2 obteve uma pontuação de 61,7% no Terminal-Bench, uma referência que mede capacidades de configuração de ambiente, face aos 47,9% do Composer 1.5, o que representa uma melhoria de 14 pontos percentuais.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A Helsing pretende angariar financiamento numa avaliação de 18 mil milhões de dólares

De acordo com o Financial Times, a Helsing, uma startup alemã de drones alimentados por IA, está a planear angariar novo financiamento numa avaliação de cerca de 18 mil milhões de dólares.

GateNews31m atrás

O co-matemático de IA do Google DeepMind atinge 47,9% no FrontierMath Tier 4, supera o GPT-5.5 Pro e resolve 3 problemas previamente insolúveis

A Google DeepMind lançou o co-matemático de IA, um assistente de investigação matemática multi-agente, alcançando 47,9% de precisão no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% a 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que todos os modelos anteriores falharam em resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador de projeto que distribui tarefas por sub-agentes encarregues d

GateNews39m atrás

O sistema de recompensas da OpenAI pontua inadvertidamente cadeias de pensamento em 6 modelos, incluindo GPT-5.4

De acordo com a equipa de alinhamento da OpenAI, a empresa descobriu recentemente um erro crítico de treino que afectava 6 grandes modelos de linguagem, incluindo o GPT-5.4. Pensamento: o mecanismo de recompensa avaliou inadvertidamente cadeias de pensamento do modelo — o processo interno de raciocínio antes de gerar respostas. O GPT-5.5 não foi afectado. O incidente viola um princípio fundamental de segurança em IA de que as cadeias de pensamento nunca devem ser avaliadas, pois fazê-lo poderia

GateNews2h atrás

A Alibaba não realizou negociações com a DeepSeek, esclarecem fontes do mercado a 9 de maio

De acordo com fontes do mercado citadas pelo Caixin Daily a 9 de Maio, a Alibaba não realizou negociações com a DeepSeek relativamente a financiamento. Este esclarecimento surge na sequência de anteriores notícias que sugeriam que as conversações entre as duas empresas teriam falhado. A DeepSeek lançou em Abril uma importante ronda de captação de fundos, que despertou interesse tanto da Tencent como da Alibaba.

GateNews2h atrás

A OpenAI lança uma ferramenta de migração do Codex para importar configurações de assistentes de IA concorrentes

De acordo com OneMillionAI (Beating), a OpenAI lançou uma ferramenta de migração no Codex que permite aos utilizadores importar configurações e dados de outros assistentes de programação de IA, incluindo o Claude Code. A ferramenta, anunciada através da conta oficial de Twitter da OpenAI, transfere automaticamente prompts do sistema, skills personalizadas, o histórico de chat de 30 dias, configurações de servidores MCP, hooks e definições de sub-agentes. A OpenAI referiu que a ferramenta de migr

GateNews2h atrás

A ByteDance aumenta a sua despesa com infraestruturas de IA em 25% para 200 mil milhões de yuan em 9 de maio

De acordo com notícias da comunicação social, a ByteDance aumentou a sua prevista despesa em infraestruturas de IA em 25% para 200 mil milhões de iuanes em 2026, à medida que a empresa acelera a implementação de inteligência artificial num contexto de aumento dos chips de memória

GateNews3h atrás
Comentar
0/400
Nenhum comentário