PANews ने 5 जनवरी को रिपोर्ट किया कि 2026 के आगमन के साथ, AI सुरक्षा क्षेत्र अपने पहले प्रमुख बेंचमार्क परीक्षण का स्वागत कर रहा है। LISABench ने आज अपने Q1 2026 मूल्यांकन की शुरुआत की घोषणा की, जिसका उद्देश्य वास्तविक दुनिया के परीक्षण के माध्यम से Web3 स्मार्ट कॉन्ट्रैक्ट भेद्यता पहचान में शीर्ष प्रदर्शन करने वाले अत्याधुनिक AI मॉडल का निर्धारण करना है। इसके अलावा, LISABench एक साथ एक सामुदायिक मतदान भविष्यवाणी पुरस्कार कार्यक्रम भी शुरू कर रहा है।
यह मूल्यांकन एक प्रभावशाली लाइनअप का दावा करता है, जो दुनिया के शीर्ष सात अत्याधुनिक मॉडलों को एक साथ लाता है—KIMI K2 (Moonshot AI), DeepSeek V3.2, QWen 3 30b-a3b (Alibaba Cloud), GLM 4.6 (Zhipu AI), GPT-5.2 (OpenAI), Gemini-3-pro-preview (Google), और Claude 4.5 Sonnet (Anthropic)—एक ही मंच पर प्रतिस्पर्धा करने के लिए।
वर्तमान में, Q1 विजेता की भविष्यवाणियों के लिए मतदान खुला है। इस बीच, LISABench बेंचमार्क कोडबेस को डेवलपर्स द्वारा समीक्षा और पुनरुत्पादन के लिए GitHub पर ओपन-सोर्स किया गया है।


