LISABench 2026 開年首測,七大頂尖 AI 模型角逐 Web3 漏洞檢測之王

币界网1月5日消息,随着 2026 年的到来,AI 安全领域迎来了首个重量级基准测试。LISABench 今日宣布启动 2026 第一季度评估,旨在通过实战测试,决出在 Web3 智能合约漏洞检测领域表现最强的前沿 AI 模型。此外,LISABench同步开展了社区投票预测的奖励活动。 本次评测阵容豪华,集结了KIMI K2 (Moonshot AI)、DeepSeek V3.2 (深度求索)、QWen 3 30b-a3b (阿里云)、GLM 4.6 (智谱 AI)、GPT-5.2 (OpenAI)、Gemini-3-pro-preview (Google)和Claude 4.5 Sonnet (Anthropic)全球最顶尖的 7 大前沿模型 (Frontier Models) 同台竞技。 目前,针对 Q1 季度获胜者的预测投票通道已经开启。同时,LISABench 的评测标准代码库已在 GitHub 开源,供开发者查阅和复现。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)