PANews повідомило 5 січня, що з настанням 2026 року сфера безпеки ШІ вітає свій перший великий еталонний тест. LISABench сьогодні оголосив про запуск оцінювання Q1 2026, спрямованого на визначення найефективнішої передової моделі ШІ у виявленні вразливостей смартконтрактів Web3 шляхом реального тестування. Крім того, LISABench одночасно запускає програму винагород за прогнозування спільноти через голосування.
Це оцінювання може похвалитися вражаючим складом учасників, об'єднавши сім найкращих передових моделей світу—KIMI K2 (Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhipu AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google) та Claude 4.5 Sonnet (Anthropic)—для змагання на одній сцені.
Наразі голосування за прогнози переможця Q1 відкрите. Тим часом, еталонна кодова база LISABench була відкрита на GitHub для перегляду та відтворення розробниками.


