OpenAI ने एक बेंचमार्किंग फ्रेमवर्क का अनावरण किया है जो यह मापने के लिए बनाया गया है कि AI एजेंट क्रिप्टो में सुरक्षा कमजोरियों का पता लगाने, उन्हें कम करने और यहां तक कि उनका फायदा उठाने में कितने प्रभावी हैंOpenAI ने एक बेंचमार्किंग फ्रेमवर्क का अनावरण किया है जो यह मापने के लिए बनाया गया है कि AI एजेंट क्रिप्टो में सुरक्षा कमजोरियों का पता लगाने, उन्हें कम करने और यहां तक कि उनका फायदा उठाने में कितने प्रभावी हैं

OpenAI स्मार्ट कॉन्ट्रैक्ट्स की रेड-टीमिंग के लिए AI एजेंट्स को एक-दूसरे के खिलाफ खड़ा करता है

2026/02/19 09:26
8 मिनट पढ़ें
Openai Pits Ai Agents Against Each Other To Red-Team Smart Contracts

OpenAI ने एक बेंचमार्किंग फ्रेमवर्क का अनावरण किया है जिसका उद्देश्य यह मापना है कि AI एजेंट क्रिप्टो स्मार्ट कॉन्ट्रैक्ट्स में सुरक्षा कमजोरियों का पता लगाने, उन्हें कम करने और यहां तक कि उनका फायदा उठाने में कितने प्रभावी हो सकते हैं। "EVMbench: Evaluating AI Agents on Smart Contract Security" शीर्षक वाली यह परियोजना Paradigm और OtterSec के सहयोग से जारी की गई, जो ब्लॉकचेन सुरक्षा और निवेश में गहरी विशेषज्ञता रखने वाली दो संस्थाएं हैं। यह अध्ययन 40 स्मार्ट कॉन्ट्रैक्ट ऑडिट से निकाली गई 120 संभावित कमजोरियों के एक संग्रहित सेट के खिलाफ AI एजेंटों का मूल्यांकन करता है, जो न केवल पता लगाने और पैचिंग क्षमताओं बल्कि नियंत्रित वातावरण में इन एजेंटों की सैद्धांतिक शोषण क्षमता को भी मापने का प्रयास करता है।

मुख्य बातें

  • EVMbench 40 स्मार्ट कॉन्ट्रैक्ट ऑडिट से संकलित 120 कमजोरियों के खिलाफ AI एजेंटों का परीक्षण करता है, जिसमें ओपन-सोर्स ऑडिट प्रतियोगिताओं से प्राप्त कमजोरियों पर जोर दिया गया है।
  • परीक्षण किए गए मॉडलों में, Anthropic के Claude Opus 4.6 ने $37,824 के औसत डिटेक्ट अवार्ड के साथ बढ़त बनाई, इसके बाद OpenAI के OC-GPT-5.2 ने $31,623 और Google के Gemini 3 Pro ने $25,112 प्राप्त किए।
  • OpenAI बेंचमार्क को "आर्थिक रूप से सार्थक वातावरणों" में AI प्रदर्शन को मापने की दिशा में एक कदम के रूप में प्रस्तुत करता है, न कि केवल खिलौना कार्यों के रूप में, जो क्रिप्टो सुरक्षा परिदृश्य में हमलावरों और रक्षकों के लिए वास्तविक दुनिया के निहितार्थों को उजागर करता है।
  • शोधकर्ताओं ने नोट किया है कि स्मार्ट कॉन्ट्रैक्ट्स अरबों डॉलर की संपत्तियों की सुरक्षा करते हैं, जो आक्रामक और रक्षात्मक गतिविधियों दोनों के लिए AI-सक्षम टूलिंग के रणनीतिक मूल्य को रेखांकित करता है।
  • उद्योग पर्यवेक्षकों ने इन विकासों को AI-संचालित भुगतानों और रोजमर्रा के लेनदेन में स्टेबलकॉइन की भूमिका के बारे में व्यापक चर्चाओं से जोड़ा है, प्रमुख अधिकारी आने वाले वर्षों में बढ़ते एजेंटिक उपयोग की भविष्यवाणी कर रहे हैं।
  • इस तरह के काम का संदर्भ 2025 के क्रिप्टो-सुरक्षा घटना डेटा द्वारा रेखांकित किया गया है, जो कमजोरियों और हमलों के माध्यम से धन के निरंतर प्रवाह को दर्शाता है, जो मजबूत AI-सक्षम ऑडिटिंग और रक्षा तंत्र की मांग को मजबूत करता है।

AI एजेंटों के लिए डिटेक्ट अवार्ड्स अध्ययन के साथ आने वाले OpenAI PDF में विस्तृत हैं, जो मूल्यांकन पद्धति और वास्तविक दुनिया के स्मार्ट-कॉन्ट्रैक्ट जोखिम का अनुकरण करने के लिए उपयोग किए गए परिदृश्यों का भी वर्णन करता है। लेखक इस बात पर जोर देते हैं कि जबकि AI एजेंट नियमित कार्यों की एक विस्तृत श्रृंखला को स्वचालित करने के लिए विकसित हुए हैं, "आर्थिक रूप से सार्थक वातावरणों" में उनके प्रदर्शन का आकलन करना यह समझने के लिए आवश्यक है कि वे उत्पादन प्रणालियों में दबाव में कैसे प्रदर्शन करेंगे।

OpenAI नोट करता है कि वह उम्मीद करता है कि एजेंटिक तकनीकें भुगतान और निपटान के दायरे को व्यापक बनाएंगी, जिसमें स्वचालित वर्कफ़्लो में उपयोग किए जाने वाले स्टेबलकॉइन शामिल हैं। AI-सक्षम भुगतानों के आसपास की चर्चा सुरक्षा परीक्षण से परे इस व्यापक सवाल तक फैली है कि स्वायत्त प्रणालियां दैनिक वित्तीय गतिविधि में कैसे भाग लेंगी। कंपनी के अपने अनुमान बताते हैं कि एजेंटिक भुगतान अधिक सामान्य हो सकते हैं, जो रोजमर्रा के उपभोक्ता लेनदेन को छूने वाले व्यावहारिक उपयोग मामलों में AI क्षमताओं को आधार प्रदान करते हैं।

बेंचमार्क परिणामों के साथ, Circle के CEO Jeremy Allaire ने सार्वजनिक रूप से भविष्यवाणी की है कि अगले पांच वर्षों में अरबों AI एजेंट रोजमर्रा के भुगतानों के लिए स्टेबलकॉइन के साथ लेनदेन कर सकते हैं। वह दृष्टिकोण क्रिप्टो सर्कल में एक आवर्ती विषय के साथ प्रतिच्छेद करता है: AI एजेंटों की मूल मुद्रा बनने के लिए क्रिप्टो की संभावना, एक कथा जिसने उद्योग के नेताओं और निवेशकों से समान रूप से उल्लेखनीय ध्यान प्राप्त किया है। जबकि इस तरह की भविष्यवाणियां अटकलबाजी बनी हुई हैं, अंतर्निहित प्रवृत्ति स्पष्ट है—AI स्वचालन प्रयोगशाला से लेनदेन परत की ओर बढ़ रहा है, जहां यह फिर से आकार दे सकता है कि नेटवर्क में मूल्य कैसे चलता है।

यह अध्ययन एक ऐसे समय में आता है जब क्रिप्टो सुरक्षा निवेशकों के लिए एक महत्वपूर्ण जोखिम कारक बनी हुई है। क्रिप्टो फंड्स पर 2025 के हमले के बारे में डेटा बिंदु—जहां हमलावरों ने लगभग $3.4 बिलियन निकाले—बेहतर टूलिंग और तेज़, अधिक विश्वसनीय पैचिंग तंत्र की तात्कालिकता को उजागर करता है। EVMbench फ्रेमवर्क को, आंशिक रूप से, यह मापने के तरीके के रूप में तैनात किया गया है कि क्या AI एजेंट पैमाने पर रक्षात्मक क्षमताओं में सार्थक योगदान दे सकते हैं, शोषण के अवसरों को कम करते हुए और खतरे के शमन को तेज करते हुए।

बेंचमार्क बनाने के लिए, शोधकर्ताओं ने 40 स्मार्ट कॉन्ट्रैक्ट ऑडिट में फैली 120 संग्रहित कमजोरियों का उपयोग किया, कई कमजोरियां ओपन-सोर्स ऑडिट चुनौतियों से जुड़ी हुई हैं। OpenAI का तर्क है कि बेंचमार्क पैमाने पर अनुबंध-स्तरीय कमजोरियों को पहचानने और कम करने में AI प्रगति को ट्रैक करने में मदद करेगा, भविष्य के AI मॉडल की तुलना करने का एक मानकीकृत तरीका प्रदान करेगा क्योंकि वे विकसित होते हैं। अध्ययन यह भी एक लेंस प्रदान करता है कि AI को अलग-अलग मामलों पर ध्यान केंद्रित करने के बजाय स्मार्ट-कॉन्ट्रैक्ट आर्किटेक्चर की एक विस्तृत श्रृंखला में जोखिम मूल्यांकन को सामान्य बनाने के लिए कैसे लागू किया जा सकता है।

स्मार्ट कॉन्ट्रैक्ट्स मनुष्यों के लिए नहीं बनाए गए थे: Dragonfly

X पर एक समकालीन थ्रेड में, Dragonfly के पार्टनर Haseeb Qureshi ने तर्क दिया कि संपत्ति के अधिकारों और पारंपरिक अनुबंधों को बदलने का क्रिप्टो का वादा कभी साकार नहीं हुआ, न कि इसलिए कि तकनीक विफल रही, बल्कि इसलिए कि इसे मानव सहज ज्ञान को ध्यान में रखकर कभी डिज़ाइन नहीं किया गया था। उन्होंने एक ऐसे वातावरण में बड़े लेनदेन पर हस्ताक्षर करने से जुड़े लगातार भय को उजागर किया है जहां ड्रेनर वॉलेट और अन्य हमले वेक्टर एक निरंतर खतरा बने हुए हैं, पारंपरिक बैंक ट्रांसफर के तुलनात्मक रूप से सहज अनुभव के बिल्कुल विपरीत।

Qureshi का तर्क है कि क्रिप्टो लेनदेन का अगला चरण AI-मध्यस्थता, स्व-चालित वॉलेट द्वारा सक्षम किया जा सकता है। ऐसे वॉलेट जोखिम की निगरानी करेंगे, जटिल संचालन का प्रबंधन करेंगे, और उपयोगकर्ताओं की ओर से खतरों का स्वायत्त रूप से जवाब देंगे, संभावित रूप से घर्षण और भय को कम करते हुए जो आज बड़े स्थानांतरण को चिह्नित करते हैं।

इस थ्रेड से व्यापक निष्कर्ष यह है कि AI एजेंट लोगों के क्रिप्टो के साथ बातचीत करने के तरीके को बदलने में एक महत्वपूर्ण भूमिका निभा सकते हैं—मैनुअल, त्रुटि-प्रवण लेनदेन से स्वचालित, जोखिम-जागरूक प्रक्रियाओं में स्थानांतरित होना जो अपनाने के साथ पैमाने पर हो सकती है। जैसे-जैसे AI एजेंट सुरक्षा चिंताओं को संभालने में अधिक क्षमता प्रदर्शित करना शुरू करते हैं, उपयोगकर्ता विकेंद्रीकृत वित्त वर्कफ़्लो में बेहतर विश्वसनीयता और लचीलापन देख सकते हैं, भले ही अंतर्निहित तकनीकें परिपक्व होती रहें।

आगे क्या देखना है

  • अतिरिक्त AI मॉडल और आर्किटेक्चर में पूर्ण EVMbench डेटासेट का प्रकाशन और स्वतंत्र प्रतिकृति।
  • सुरक्षा मुद्रा को मजबूत करने के इच्छुक ऑडिटर, एक्सचेंज और DeFi परियोजनाओं द्वारा AI-सहायता प्राप्त ऑडिटिंग वर्कफ़्लो की व्यापक स्वीकृति।
  • एजेंटिक वॉलेट और स्वायत्त भुगतान प्रवाह में खोज, जिसमें AI-प्रबंधित संपत्तियों के लिए नियामक और अनुपालन विचार शामिल हैं।
  • नए संस्करणों के रोल आउट होने पर अधिक AI सिस्टम की तुलना करने वाले अनुवर्ती बेंचमार्क, पता लगाने की सटीकता और पैचिंग गति में सुधार को ट्रैक करना।

स्रोत और सत्यापन

  • OpenAI: EVMbench: Evaluating AI Agents on Smart Contract Security — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: Introducing EVMbench — https://openai.com/index/introducing-evmbench/
  • Crypto security losses in 2025 (reporting coverage): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Haseeb Qureshi on AI and crypto UX (X post): https://x.com/hosseeb/status/2024136762424185208
  • China's AI lead and crypto implications (analysis): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw and AI bot developments in Polymarket coverage: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

प्रमुख आंकड़े और अगले कदम

EVMbench अध्ययन दर्शाता है कि बड़े भाषा मॉडल और संबंधित AI एजेंट स्मार्ट कॉन्ट्रैक्ट स्पेस में सार्थक सुरक्षा कार्य करना शुरू कर रहे हैं, मॉडल में स्पष्ट रूप से मापने योग्य अंतर के साथ। औसत डिटेक्ट अवार्ड्स में Claude Opus 4.6 की बढ़त यह संकेत देती है कि कुछ आर्किटेक्चर जटिल कॉन्ट्रैक्ट लॉजिक के भीतर कमजोरियों को खोजने और कम करने में अधिक कुशल हो सकते हैं, जबकि अन्य पीछे रह जाते हैं, क्षमताओं का एक स्पेक्ट्रम पेश करते हैं जिसे शोधकर्ता शायद परिष्कृत करना चाहेंगे। परियोजना में कई उद्योग भागीदारियों का समावेश बढ़ती आम सहमति को रेखांकित करता है कि AI-सक्षम सुरक्षा और स्वचालित जोखिम प्रबंधन विकेंद्रीकृत वातावरणों में पैमाने के लिए आवश्यक हो सकता है।

जैसे-जैसे क्षेत्र विकसित होता है, पर्यवेक्षक इस बात पर नज़र रखेंगे कि AI एजेंट कितनी जल्दी पता लगाने से उपचार में संक्रमण कर सकते हैं, और क्या ये एजेंट नए जोखिम पैदा किए बिना लाइव सिस्टम में विश्वसनीय रूप से काम कर सकते हैं। AI-संचालित वॉलेट और स्वायत्त भुगतानों के बारे में बातचीत सुरक्षा शासन, उपयोगकर्ता सहमति और नियामक संरेखण के आसपास के सवालों के एक व्यापक सेट को छूती है। यदि OpenAI और उसके साझेदारों द्वारा सुझाया गया प्रक्षेपवक्र जारी रहता है, तो AI-सहायता प्राप्त उपकरण भविष्य की क्रिप्टो बुनियादी ढांचे का एक मुख्य घटक बन सकते हैं, जोखिम गणना और उपयोगकर्ता अनुभव दोनों को सार्थक तरीकों से बदलते हुए। बेंचमार्क का अगला दौर, वास्तविक दुनिया की तैनाती के साथ, यह निर्धारित करने में मदद करेगा कि यह दृष्टि कितनी जल्दी साकार होती है और इसके साथ कौन से सुरक्षा उपाय होने चाहिए।

यह लेख मूल रूप से OpenAI Pits AI Agents Against Each Other to Red-Team Smart Contracts के रूप में Crypto Breaking News पर प्रकाशित हुआ था — आपके विश्वसनीय स्रोत क्रिप्टो न्यूज़, Bitcoin न्यूज़, और ब्लॉकचेन अपडेट्स के लिए।

मार्केट अवसर
Smart Blockchain लोगो
Smart Blockchain मूल्य(SMART)
$0.004394
$0.004394$0.004394
-1.98%
USD
Smart Blockchain (SMART) मूल्य का लाइव चार्ट
अस्वीकरण: इस साइट पर बाहर से पोस्ट किए गए लेख, सार्वजनिक प्लेटफार्म से लिए गए हैं और केवल सूचना देने के उद्देश्यों के लिए उपलब्ध कराए गए हैं. वे निश्चित तौर पर MEXC के विचारों को नहीं दिखाते. सभी संबंधित अधिकार मूल लेखकों के पास ही हैं. अगर आपको लगता है कि कोई कॉन्टेंट तीसरे पक्ष के अधिकारों का उल्लंघन करता है, तो कृपया उसे हटाने के लिए service@support.mexc.com से संपर्क करें. MEXC किसी कॉन्टेंट की सटीकता, पूर्णता या समयबद्धता के संबंध में कोई गारंटी नहीं देता है और प्रदान की गई जानकारी के आधार पर की गई किसी भी कार्रवाई के लिए जिम्मेदार नहीं है. यह कॉन्टेंट वित्तीय, कानूनी या अन्य प्रोफ़ेशनल सलाह नहीं है, न ही इसे MEXC द्वारा अनुशंसा या समर्थन माना जाना चाहिए.

आपको यह भी पसंद आ सकता है

ट्रंप जूनियर का बचाव ढह गया क्योंकि संदिग्ध $500M सौदे में 'उल्लेखनीय गैर-जवाब' उजागर हुआ

ट्रंप जूनियर का बचाव ढह गया क्योंकि संदिग्ध $500M सौदे में 'उल्लेखनीय गैर-जवाब' उजागर हुआ

डोनाल्ड ट्रंप जूनियर के पास कोई वैध बहाना नहीं था जब उन्होंने क्रिप्टो फर्म का बचाव करने की कोशिश की, जिसे स्थापित करने में उन्होंने मदद की थी, जो संयुक्त राज्य से जुड़ी एक कंपनी से $500 मिलियन का निवेश ले रही थी
शेयर करें
Rawstory2026/02/19 09:05
थके हुए वकीलों द्वारा ट्रंप DOJ के 'असामान्य' व्यवहार के खिलाफ युद्ध की घोषणा

थके हुए वकीलों द्वारा ट्रंप DOJ के 'असामान्य' व्यवहार के खिलाफ युद्ध की घोषणा

एक रिपोर्ट के अनुसार, आपराधिक बचाव वकीलों के एक समूह ने ट्रंप न्याय विभाग के "असामान्य व्यवहार" के खिलाफ युद्ध छेड़ दिया है। वकीलों ने मिलकर
शेयर करें
Rawstory2026/02/19 10:03
सैंटिमेंट द्वारा Ethereum की 50% स्टेकिंग आंकड़े पर शोधकर्ताओं की आलोचना

सैंटिमेंट द्वारा Ethereum की 50% स्टेकिंग आंकड़े पर शोधकर्ताओं की आलोचना

सैंटिमेंट द्वारा Ethereum की 50% स्टेकिंग आंकड़ा शोधकर्ताओं से आलोचना को आकर्षित करता है यह पोस्ट BitcoinEthereumNews.com पर प्रकाशित हुई। Ethereum ने एक प्रतीकात्मक सीमा पार कर ली है
शेयर करें
BitcoinEthereumNews2026/02/19 10:40