LISABench 2026 開幕最初のテスト、7つのトップAIモデルがWeb3脆弱性検出の王者を競う

Binanceの1月5日のニュースによると、2026年の到来とともに、AIセキュリティ分野は初のヘビー級ベンチマークの到来を迎えました。 LISABenchは本日、Web3スマートコントラクト脆弱性検出分野で最も強力な最先端AIモデルを実践的なテストを通じて決定する2026年第1四半期評価の開始を発表しました。 さらに、LISABenchは同時にコミュニティ投票予測の報酬キャンペーンを開始しました。 このレビューは豪華なラインナップで、KIMI K2を組み立てています (ムーンショットAI)、DeepSeek V3.2 (ディープサーチ)、QWen 3 30b-a3b (アリは言った)、GLM 4.6 (スマートスペクトラムAI)、GPT-5.2 (OpenAI)、Gemini-3-pro-preview (グーグル)そしてクロード4.5ソネット (人格的)世界のトップ7の最先端モデル (フロンティアモデル) 同じステージで競い合いましょう。 現在、第1四半期の勝者予測投票チャンネルは開放されています。 同時に、LISABenchのCriterionコードベースはGitHub上でオープンソースで、開発者がレビュー・再現できます。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン