LISABench 2026 Primeira prova do ano, sete dos principais modelos de IA competem pelo título de rei na deteção de vulnerabilidades Web3

2026-01-05 06:30:10

O site Coin界1 de janeiro de 2024 informa que, com a chegada de 2026, o campo de segurança de IA recebeu o seu primeiro teste de referência de peso. A LISABench anunciou hoje o lançamento da avaliação do primeiro trimestre de 2026, com o objetivo de determinar, através de testes práticos, qual o modelo de IA de ponta que apresenta o melhor desempenho na deteção de vulnerabilidades em contratos inteligentes Web3. Além disso, a LISABench lançou uma atividade de votação comunitária com prémios de previsão. A competição conta com um elenco de luxo, reunindo KIMI K2 (Moonshot AI), DeepSeek V3.2 (深度求索), QWen 3 30b-a3b (阿里云), GLM 4.6 (智谱 AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) e Claude 4.5 Sonnet (Anthropic), os sete modelos de ponta mais avançados do mundo (Frontier Models) competem entre si. Atualmente, o canal de votação para prever o vencedor do Q1 já está aberto. Ao mesmo tempo, o repositório de código de padrão de avaliação da LISABench foi aberto no GitHub, para consulta e reprodução por desenvolvedores.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.