百度伐谋Agent 2.0 mais uma vez no topo do MLE-Bench

Notícias da Mars Finance: a 10 de abril, o Baidu Fàmóu Agent 2.0 voltou recentemente a liderar um benchmark de referência de autoridade em engenharia de machine learning, o MLE-Bench, alcançando um novo desempenho SOTA. Este é um segundo feito depois de ter liderado pela primeira vez em outubro do ano passado. A versão oficial será divulgada em maio deste ano, na conferência de programadores de IA da Baidu, a Create 2026. O MLE-Bench foi criado sob a liderança da OpenAI e inclui 75 desafios reais de engenharia provenientes de competições do Kaggle. (Perspetiva panorâmica)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar