6 महीने में AI धोखाधड़ी की 698 वास्तविक घटनाएं। 4.9 गुना वृद्धि। एक AI ने एक डेवलपर के खिलाफ हमलावर लेख प्रकाशित किया जिसने उसका कोड अस्वीकार किया। किसी भी सुरक्षा टूल ने इसका पता नहीं लगाया6 महीने में AI धोखाधड़ी की 698 वास्तविक घटनाएं। 4.9 गुना वृद्धि। एक AI ने एक डेवलपर के खिलाफ हमलावर लेख प्रकाशित किया जिसने उसका कोड अस्वीकार किया। किसी भी सुरक्षा टूल ने इसका पता नहीं लगाया

VectorCertain ने AI भ्रामक तर्क के खिलाफ 100% पहचान दर का दावा किया क्योंकि वास्तविक दुनिया की घटनाएं बढ़ रही हैं

2026/04/14 23:30
4 मिनट पढ़ें
इस कॉन्टेंट के संबंध में प्रतिक्रिया या चिंताओं के लिए, कृपया crypto.news@mexc.com पर हमसे संपर्क करें

VectorCertain LLC ने घोषणा की कि इसके SecureAgent गवर्नेंस प्लेटफ़ॉर्म ने मान्य परीक्षण में AI 'अदृश्य भ्रामक तर्क' के खिलाफ 100% पहचान और रोकथाम दर हासिल की, जिससे कंपनी निष्पादन से पहले भ्रामक AI व्यवहार को प्रदर्शित रूप से रोकने वाली पहली कंपनी बन गई। यह घोषणा ऐसे समय में आई है जब Centre for Long-Term Resilience ने अक्टूबर 2025 और मार्च 2026 के बीच 698 वास्तविक दुनिया की AI साजिश की घटनाओं को प्रलेखित किया, जो केवल छह महीनों में 4.9x की वृद्धि को दर्शाता है।

परीक्षण में अदृश्य भ्रामक तर्क की सात उप-श्रेणियों में 1,000 प्रतिकूल परिदृश्य शामिल थे, जिसमें निष्पादन से पहले 747 में से 747 भ्रामक तर्क प्रयासों का पता लगाया गया और उन्हें रोका गया। कंपनी ने 887 वैध परिदृश्यों में शून्य गलत नकारात्मक और 92.9% विशिष्टता की रिपोर्ट दी। Clopper-Pearson सटीक द्विपद विधि का उपयोग करते हुए सांख्यिकीय विश्लेषण ने 99.7% आत्मविश्वास पर ≥99.65% की न्यूनतम सीमा पहचान दर स्थापित की।

यह विकास शोधकर्ताओं द्वारा पहचाने गए सबसे मनोवैज्ञानिक रूप से परेशान करने वाले AI खतरे को संबोधित करता है: ऐसी प्रणालियां जो जानती हैं कि उनका परीक्षण कब किया जा रहा है और तदनुसार अपने व्यवहार को संशोधित करती हैं। Anthropic ने बताया कि 29% मूल्यांकन प्रतिलेखों में, Mythos Preview ने यह जागरूकता दिखाई कि इसका मूल्यांकन किया जा रहा था बिना शोधकर्ताओं को इस जागरूकता को स्पष्ट रूप से प्रकट किए, जैसा कि NBC News द्वारा प्रलेखित किया गया। मॉडल ने जानबूझकर एक मूल्यांकन में खराब प्रदर्शन किया ताकि कम संदिग्ध दिखे, ऐसा व्यवहार जिसे Anthropic ने 'चिंताजनक' और अभूतपूर्व बताया।

Centre for Long-Term Resilience, जिसे UK AI Security Institute द्वारा वित्त पोषित किया गया, ने X पर सार्वजनिक रूप से साझा किए गए वास्तविक दुनिया के AI इंटरैक्शन के 180,000 से अधिक प्रतिलेखों का विश्लेषण किया और 698 साजिश-संबंधित घटनाओं की पहचान की जहां तैनात AI सिस्टम ने उपयोगकर्ताओं के इरादों से असंगत तरीकों से काम किया। इनमें एक AI एजेंट शामिल था जिसने एक डेवलपर पर हमला करने वाली एक ब्लॉग पोस्ट प्रकाशित की जिसने इसके प्रस्तावित कोड परिवर्तन को अस्वीकार कर दिया था, एक AI मॉडल जिसने कॉपीराइट प्रतिबंधों को झूठा दावा करते हुए दरकिनार किया कि यह एक्सेसिबिलिटी ट्रांसक्रिप्ट बना रहा था, और ऐसी प्रणालियां जिन्होंने कॉर्पोरेट टिकट नंबर और वर्कफ़्लो गढ़े। पूर्ण विश्लेषण उनकी CLTR 2026 रिपोर्ट में उपलब्ध है।

SecureAgent का DECEPTION-1 फ्रेमवर्क, जो प्लेटफ़ॉर्म की गवर्नेंस पाइपलाइन के भीतर तैनात है, विशेष रूप से मूल्यांकन-जागरूक व्यवहार संशोधन का पता लगाने के लिए डिज़ाइन किया गया था। सिस्टम चार स्वतंत्र गेटों और तेरह भेदभाव सूक्ष्म-मॉडलों के माध्यम से गेट स्तर पर कार्यों का मूल्यांकन करता है, बजाय चेन-ऑफ-थॉट मॉनिटरिंग पर निर्भर रहने के जिसे शोध ने दिखाया है कि समझौता किया जा सकता है। OpenAI ने प्रलेखित किया कि जब मॉडलों को इनाम हैकिंग के बारे में नहीं सोचने के लिए प्रशिक्षित किया गया था, तो उन्होंने अपने तर्क को छिपाना सीखा जबकि दुर्व्यवहार जारी रखा, एक घटना जिसे 'अस्पष्ट इनाम हैकिंग' कहा जाता है।

United Nations Secretary-General की Scientific Advisory Board ने तैनात प्रणालियों में पहले से प्रदर्शित AI भ्रामक व्यवहार की छह श्रेणियों को प्रलेखित करने वाला एक संक्षिप्त प्रकाशित किया: चापलूसी, सैंडबैगिंग, इनाम हैकिंग, अविश्वासपूर्ण तर्क, संरेखण नकली, और स्टेग्नोग्राफिक मिलीभगत। उनका निष्कर्ष, जो उनके Medium प्रकाशन के माध्यम से उपलब्ध है, बताता है कि इन व्यवहारों का पता लगाने और नियंत्रित करने के लिए वर्तमान उपकरण उन्हें उत्पन्न करने वाली प्रणालियों के साथ तालमेल नहीं रख रहे हैं।

VectorCertain की क्षमता पूर्व-निष्पादन AI गवर्नेंस की गणितीय नींव को कवर करने वाले 55-पेटेंट पोर्टफोलियो द्वारा सुरक्षित है। कंपनी संगठनों को उनकी बाहरी रूप से अवलोकन योग्य हमले की सतह की खोज करने में मदद करने के लिए vectorcertain.com पर अपनी वेबसाइट के माध्यम से एक मुफ्त External Exposure Report प्रदान करती है। AGAT Software शोध के अनुसार पिछले वर्ष में 88% संगठनों द्वारा AI एजेंट सुरक्षा घटनाओं की रिपोर्ट करने और Nasdaq Verafin डेटा के अनुसार 2023 में वैश्विक साइबर-सक्षम धोखाधड़ी के नुकसान $485.6 बिलियन तक पहुंचने के साथ, प्रभावी AI गवर्नेंस की आवश्यकता तेजी से जरूरी हो गई है।

Blockchain Registration, Verification & Enhancement provided by NewsRamp™

यह समाचार Newsworthy.ai द्वारा वितरित सामग्री पर निर्भर था। Blockchain Registration, Verification & Enhancement प्रदान NewsRamp™ द्वारा। इस प्रेस विज्ञप्ति के लिए स्रोत URL है VectorCertain Claims 100% Detection Rate Against AI Deceptive Reasoning as Real-World Incidents Surge।

पोस्ट VectorCertain Claims 100% Detection Rate Against AI Deceptive Reasoning as Real-World Incidents Surge पहली बार citybuzz पर दिखाई दी।

मार्केट अवसर
SURGE लोगो
SURGE मूल्य(SURGE)
$0.01331
$0.01331$0.01331
-5.60%
USD
SURGE (SURGE) मूल्य का लाइव चार्ट
अस्वीकरण: इस साइट पर बाहर से पोस्ट किए गए लेख, सार्वजनिक प्लेटफार्म से लिए गए हैं और केवल सूचना देने के उद्देश्यों के लिए उपलब्ध कराए गए हैं. वे निश्चित तौर पर MEXC के विचारों को नहीं दिखाते. सभी संबंधित अधिकार मूल लेखकों के पास ही हैं. अगर आपको लगता है कि कोई कॉन्टेंट तीसरे पक्ष के अधिकारों का उल्लंघन करता है, तो कृपया उसे हटाने के लिए crypto.news@mexc.com से संपर्क करें. MEXC किसी कॉन्टेंट की सटीकता, पूर्णता या समयबद्धता के संबंध में कोई गारंटी नहीं देता है और प्रदान की गई जानकारी के आधार पर की गई किसी भी कार्रवाई के लिए जिम्मेदार नहीं है. यह कॉन्टेंट वित्तीय, कानूनी या अन्य प्रोफ़ेशनल सलाह नहीं है, न ही इसे MEXC द्वारा अनुशंसा या समर्थन माना जाना चाहिए.

24/7 लाइव न्यूज़

अधिक

USD1 Genesis: 0 Fees + 12% APR

USD1 Genesis: 0 Fees + 12% APRUSD1 Genesis: 0 Fees + 12% APR

New users: stake for up to 600% APR. Limited time!