火讯财经讯,1月5日消息,随着2026年的到来,AI安全领域迎来了首个重量级基准测试。LISABench今日宣布启动2026第一季度评估,旨在通过实战测试,决出在Web3智能合约漏洞检测领域表现最强的前沿AI模型。此外,LISABench同步开展了社区投票预测的奖励活动。
本次评测阵容豪华,集结了KIMIK2(MoonshotAI)、DeepSeekV3.2(深度求索)、QWen330b-a3b(阿里云)、GLM4.6(智谱AI)、GPT-5.2(OpenAI)、Gemini-3-pro-preview(Google)和Claude4.5Sonnet(Anthropic)全球最顶尖的7大前沿模型(FrontierModels)同台竞技。
目前,针对Q1季度获胜者的预测投票通道已经开启。同时,LISABench的评测标准代码库已在GitHub开源,供开发者查阅和复现。
12 分钟前