O site Coin界1 de janeiro de 2024 informa que, com a chegada de 2026, o campo de segurança de IA recebeu o seu primeiro teste de referência de peso. A LISABench anunciou hoje o lançamento da avaliação do primeiro trimestre de 2026, com o objetivo de determinar, através de testes práticos, qual o modelo de IA de ponta que apresenta o melhor desempenho na deteção de vulnerabilidades em contratos inteligentes Web3. Além disso, a LISABench lançou uma atividade de votação comunitária com prémios de previsão. A competição conta com um elenco de luxo, reunindo KIMI K2 (Moonshot AI), DeepSeek V3.2 (深度求索), QWen 3 30b-a3b (阿里云), GLM 4.6 (智谱 AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) e Claude 4.5 Sonnet (Anthropic), os sete modelos de ponta mais avançados do mundo (Frontier Models) competem entre si. Atualmente, o canal de votação para prever o vencedor do Q1 já está aberto. Ao mesmo tempo, o repositório de código de padrão de avaliação da LISABench foi aberto no GitHub, para consulta e reprodução por desenvolvedores.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
LISABench 2026 Primeira prova do ano, sete dos principais modelos de IA competem pelo título de rei na deteção de vulnerabilidades Web3
O site Coin界1 de janeiro de 2024 informa que, com a chegada de 2026, o campo de segurança de IA recebeu o seu primeiro teste de referência de peso. A LISABench anunciou hoje o lançamento da avaliação do primeiro trimestre de 2026, com o objetivo de determinar, através de testes práticos, qual o modelo de IA de ponta que apresenta o melhor desempenho na deteção de vulnerabilidades em contratos inteligentes Web3. Além disso, a LISABench lançou uma atividade de votação comunitária com prémios de previsão. A competição conta com um elenco de luxo, reunindo KIMI K2 (Moonshot AI), DeepSeek V3.2 (深度求索), QWen 3 30b-a3b (阿里云), GLM 4.6 (智谱 AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) e Claude 4.5 Sonnet (Anthropic), os sete modelos de ponta mais avançados do mundo (Frontier Models) competem entre si. Atualmente, o canal de votação para prever o vencedor do Q1 já está aberto. Ao mesmo tempo, o repositório de código de padrão de avaliação da LISABench foi aberto no GitHub, para consulta e reprodução por desenvolvedores.