OpenAI ने एक बेंचमार्किंग फ्रेमवर्क का अनावरण किया है जिसका उद्देश्य यह मापना है कि AI एजेंट क्रिप्टो स्मार्ट कॉन्ट्रैक्ट्स में सुरक्षा कमजोरियों का पता लगाने, उन्हें कम करने और यहां तक कि उनका फायदा उठाने में कितने प्रभावी हो सकते हैं। "EVMbench: Evaluating AI Agents on Smart Contract Security" शीर्षक वाली यह परियोजना Paradigm और OtterSec के सहयोग से जारी की गई, जो ब्लॉकचेन सुरक्षा और निवेश में गहरी विशेषज्ञता रखने वाली दो संस्थाएं हैं। यह अध्ययन 40 स्मार्ट कॉन्ट्रैक्ट ऑडिट से निकाली गई 120 संभावित कमजोरियों के एक संग्रहित सेट के खिलाफ AI एजेंटों का मूल्यांकन करता है, जो न केवल पता लगाने और पैचिंग क्षमताओं बल्कि नियंत्रित वातावरण में इन एजेंटों की सैद्धांतिक शोषण क्षमता को भी मापने का प्रयास करता है।
AI एजेंटों के लिए डिटेक्ट अवार्ड्स अध्ययन के साथ आने वाले OpenAI PDF में विस्तृत हैं, जो मूल्यांकन पद्धति और वास्तविक दुनिया के स्मार्ट-कॉन्ट्रैक्ट जोखिम का अनुकरण करने के लिए उपयोग किए गए परिदृश्यों का भी वर्णन करता है। लेखक इस बात पर जोर देते हैं कि जबकि AI एजेंट नियमित कार्यों की एक विस्तृत श्रृंखला को स्वचालित करने के लिए विकसित हुए हैं, "आर्थिक रूप से सार्थक वातावरणों" में उनके प्रदर्शन का आकलन करना यह समझने के लिए आवश्यक है कि वे उत्पादन प्रणालियों में दबाव में कैसे प्रदर्शन करेंगे।
OpenAI नोट करता है कि वह उम्मीद करता है कि एजेंटिक तकनीकें भुगतान और निपटान के दायरे को व्यापक बनाएंगी, जिसमें स्वचालित वर्कफ़्लो में उपयोग किए जाने वाले स्टेबलकॉइन शामिल हैं। AI-सक्षम भुगतानों के आसपास की चर्चा सुरक्षा परीक्षण से परे इस व्यापक सवाल तक फैली है कि स्वायत्त प्रणालियां दैनिक वित्तीय गतिविधि में कैसे भाग लेंगी। कंपनी के अपने अनुमान बताते हैं कि एजेंटिक भुगतान अधिक सामान्य हो सकते हैं, जो रोजमर्रा के उपभोक्ता लेनदेन को छूने वाले व्यावहारिक उपयोग मामलों में AI क्षमताओं को आधार प्रदान करते हैं।
बेंचमार्क परिणामों के साथ, Circle के CEO Jeremy Allaire ने सार्वजनिक रूप से भविष्यवाणी की है कि अगले पांच वर्षों में अरबों AI एजेंट रोजमर्रा के भुगतानों के लिए स्टेबलकॉइन के साथ लेनदेन कर सकते हैं। वह दृष्टिकोण क्रिप्टो सर्कल में एक आवर्ती विषय के साथ प्रतिच्छेद करता है: AI एजेंटों की मूल मुद्रा बनने के लिए क्रिप्टो की संभावना, एक कथा जिसने उद्योग के नेताओं और निवेशकों से समान रूप से उल्लेखनीय ध्यान प्राप्त किया है। जबकि इस तरह की भविष्यवाणियां अटकलबाजी बनी हुई हैं, अंतर्निहित प्रवृत्ति स्पष्ट है—AI स्वचालन प्रयोगशाला से लेनदेन परत की ओर बढ़ रहा है, जहां यह फिर से आकार दे सकता है कि नेटवर्क में मूल्य कैसे चलता है।
यह अध्ययन एक ऐसे समय में आता है जब क्रिप्टो सुरक्षा निवेशकों के लिए एक महत्वपूर्ण जोखिम कारक बनी हुई है। क्रिप्टो फंड्स पर 2025 के हमले के बारे में डेटा बिंदु—जहां हमलावरों ने लगभग $3.4 बिलियन निकाले—बेहतर टूलिंग और तेज़, अधिक विश्वसनीय पैचिंग तंत्र की तात्कालिकता को उजागर करता है। EVMbench फ्रेमवर्क को, आंशिक रूप से, यह मापने के तरीके के रूप में तैनात किया गया है कि क्या AI एजेंट पैमाने पर रक्षात्मक क्षमताओं में सार्थक योगदान दे सकते हैं, शोषण के अवसरों को कम करते हुए और खतरे के शमन को तेज करते हुए।
बेंचमार्क बनाने के लिए, शोधकर्ताओं ने 40 स्मार्ट कॉन्ट्रैक्ट ऑडिट में फैली 120 संग्रहित कमजोरियों का उपयोग किया, कई कमजोरियां ओपन-सोर्स ऑडिट चुनौतियों से जुड़ी हुई हैं। OpenAI का तर्क है कि बेंचमार्क पैमाने पर अनुबंध-स्तरीय कमजोरियों को पहचानने और कम करने में AI प्रगति को ट्रैक करने में मदद करेगा, भविष्य के AI मॉडल की तुलना करने का एक मानकीकृत तरीका प्रदान करेगा क्योंकि वे विकसित होते हैं। अध्ययन यह भी एक लेंस प्रदान करता है कि AI को अलग-अलग मामलों पर ध्यान केंद्रित करने के बजाय स्मार्ट-कॉन्ट्रैक्ट आर्किटेक्चर की एक विस्तृत श्रृंखला में जोखिम मूल्यांकन को सामान्य बनाने के लिए कैसे लागू किया जा सकता है।
X पर एक समकालीन थ्रेड में, Dragonfly के पार्टनर Haseeb Qureshi ने तर्क दिया कि संपत्ति के अधिकारों और पारंपरिक अनुबंधों को बदलने का क्रिप्टो का वादा कभी साकार नहीं हुआ, न कि इसलिए कि तकनीक विफल रही, बल्कि इसलिए कि इसे मानव सहज ज्ञान को ध्यान में रखकर कभी डिज़ाइन नहीं किया गया था। उन्होंने एक ऐसे वातावरण में बड़े लेनदेन पर हस्ताक्षर करने से जुड़े लगातार भय को उजागर किया है जहां ड्रेनर वॉलेट और अन्य हमले वेक्टर एक निरंतर खतरा बने हुए हैं, पारंपरिक बैंक ट्रांसफर के तुलनात्मक रूप से सहज अनुभव के बिल्कुल विपरीत।
Qureshi का तर्क है कि क्रिप्टो लेनदेन का अगला चरण AI-मध्यस्थता, स्व-चालित वॉलेट द्वारा सक्षम किया जा सकता है। ऐसे वॉलेट जोखिम की निगरानी करेंगे, जटिल संचालन का प्रबंधन करेंगे, और उपयोगकर्ताओं की ओर से खतरों का स्वायत्त रूप से जवाब देंगे, संभावित रूप से घर्षण और भय को कम करते हुए जो आज बड़े स्थानांतरण को चिह्नित करते हैं।
इस थ्रेड से व्यापक निष्कर्ष यह है कि AI एजेंट लोगों के क्रिप्टो के साथ बातचीत करने के तरीके को बदलने में एक महत्वपूर्ण भूमिका निभा सकते हैं—मैनुअल, त्रुटि-प्रवण लेनदेन से स्वचालित, जोखिम-जागरूक प्रक्रियाओं में स्थानांतरित होना जो अपनाने के साथ पैमाने पर हो सकती है। जैसे-जैसे AI एजेंट सुरक्षा चिंताओं को संभालने में अधिक क्षमता प्रदर्शित करना शुरू करते हैं, उपयोगकर्ता विकेंद्रीकृत वित्त वर्कफ़्लो में बेहतर विश्वसनीयता और लचीलापन देख सकते हैं, भले ही अंतर्निहित तकनीकें परिपक्व होती रहें।
EVMbench अध्ययन दर्शाता है कि बड़े भाषा मॉडल और संबंधित AI एजेंट स्मार्ट कॉन्ट्रैक्ट स्पेस में सार्थक सुरक्षा कार्य करना शुरू कर रहे हैं, मॉडल में स्पष्ट रूप से मापने योग्य अंतर के साथ। औसत डिटेक्ट अवार्ड्स में Claude Opus 4.6 की बढ़त यह संकेत देती है कि कुछ आर्किटेक्चर जटिल कॉन्ट्रैक्ट लॉजिक के भीतर कमजोरियों को खोजने और कम करने में अधिक कुशल हो सकते हैं, जबकि अन्य पीछे रह जाते हैं, क्षमताओं का एक स्पेक्ट्रम पेश करते हैं जिसे शोधकर्ता शायद परिष्कृत करना चाहेंगे। परियोजना में कई उद्योग भागीदारियों का समावेश बढ़ती आम सहमति को रेखांकित करता है कि AI-सक्षम सुरक्षा और स्वचालित जोखिम प्रबंधन विकेंद्रीकृत वातावरणों में पैमाने के लिए आवश्यक हो सकता है।
जैसे-जैसे क्षेत्र विकसित होता है, पर्यवेक्षक इस बात पर नज़र रखेंगे कि AI एजेंट कितनी जल्दी पता लगाने से उपचार में संक्रमण कर सकते हैं, और क्या ये एजेंट नए जोखिम पैदा किए बिना लाइव सिस्टम में विश्वसनीय रूप से काम कर सकते हैं। AI-संचालित वॉलेट और स्वायत्त भुगतानों के बारे में बातचीत सुरक्षा शासन, उपयोगकर्ता सहमति और नियामक संरेखण के आसपास के सवालों के एक व्यापक सेट को छूती है। यदि OpenAI और उसके साझेदारों द्वारा सुझाया गया प्रक्षेपवक्र जारी रहता है, तो AI-सहायता प्राप्त उपकरण भविष्य की क्रिप्टो बुनियादी ढांचे का एक मुख्य घटक बन सकते हैं, जोखिम गणना और उपयोगकर्ता अनुभव दोनों को सार्थक तरीकों से बदलते हुए। बेंचमार्क का अगला दौर, वास्तविक दुनिया की तैनाती के साथ, यह निर्धारित करने में मदद करेगा कि यह दृष्टि कितनी जल्दी साकार होती है और इसके साथ कौन से सुरक्षा उपाय होने चाहिए।
यह लेख मूल रूप से OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts के रूप में Crypto Breaking News पर प्रकाशित हुआ था — आपके विश्वसनीय स्रोत क्रिप्टो न्यूज़, Bitcoin न्यूज़, और ब्लॉकचेन अपडेट्स के लिए।


