OpenAI on avalikustanud võrdlusrakenduse, mis aitab hinnata, kui efektiivselt suudavad AI-agentid krüptovaluutades turvavead avastada, leevendada ja isegi ära kasutada.OpenAI on avalikustanud võrdlusrakenduse, mis aitab hinnata, kui efektiivselt suudavad AI-agentid krüptovaluutades turvavead avastada, leevendada ja isegi ära kasutada.

OpenAI võtab AI-agentid omavahel võistlustulle, et nutikaid lepinguid red-teemaliseks testida.

2026/02/19 09:26
5 minutiline lugemine
Selle sisu kohta tagasiside või murede korral võtke meiega ühendust aadressil crypto.news@mexc.com
OpenAI võistleb AI-agentidega, et red-teamida nutikaid lepinguid

OpenAI on avaldanud benchmarking-raamistiku, mille eesmärk on hinnata, kui efektiivselt suudavad AI-agentid tuvastada, leevendada ja isegi ära kasutada turvariskidega seotud nõrkusi krüptosidest nutikates lepingutes. Projekti pealkiri „EVMbench: AI-agentide hindamine nutikate lepingute turvalisuses“ sai avaldatud koostöös Paradigmi ja OtterSeciga – kahe organisatsiooniga, kes on sügavalt pühendunud blockchaini turvalisusele ja investeeringutele. Uuringu käigus hinnatakse AI-agentide võimeid 120 valitud nõrkuse vastu, mis on pärinevad 40 nutika lepingu auditi tulemustest, püüdes mitte ainult kvantifitseerida nende detekteerimis- ja parandamisvõimeid, vaid ka hinnata nende agentide teoreetilist ekspluateerimisvõimalust kontrollitud keskkonnas.

Põhijäreldused

  • EVMbench testib AI-agentide võimeid 120 nõrkuse vastu, mis on valitud 40 nutika lepingu auditi tulemustest; rõhk on avatud allikatest pärit nõrkustel, mida on kogutud erinevatelt auditikonkurssidelt.
  • Katsetatud mudelite seas juhtis Anthropic’i Claude Opus 4.6, saades keskmiseks detekteerimisauhinnaks 37 824 dollarit, järgnesid OpenAI OC-GPT-5.2 31 623 dollariga ja Google Gemini 3 Pro 25 112 dollariga.
  • OpenAI käsitleb seda benchmarkingut kui sammu edasi, et hinnata AI-tehnoloogiate jõudlust „majanduslikult olulistel keskkondadel“, mitte lihtsalt mängulistes ülesannetes, rõhutades krüptoturvalisuse maailmas ründajate ja kaitsejõudude reaalset mõju.
  • Uurijad toovad esile, et nutikad lepingud kaitsevad miljardeid dollareid varasid, mis rõhutab AI-toega tööriistade strateegilist väärtust nii ründajate kui ka kaitsejõudude jaoks.
  • Tööstuse vaatlejad seostavad neid arenguid laiemate aruteludega AI-põhistest maksetest ja stabiilsete mündide rollist igapäevastes tehingutes, kus suured juhid ennustavad agentic-tehnoloogiate kasutamise kasvu lähiaastatel.
  • Selle töö konteksti rõhutab 2025. aasta krüptoturvalisuse juhtumite andmete analüüs, mis näitab endiselt rikkumiste ja rünnakute kaudu toimuvat rahavoogu, mis tugevdab nõudlust tugevate AI-toega auditeerimis- ja kaitsemeetodite järele.

AI-agentide detekteerimisauhindu kirjeldatakse OpenAI uuringuga kaasnevas PDF-failis, kus samuti selgitatakse hindamismetoodikat ja stsenaariume, mille abil simuleeritakse reaalseid nutikate lepingute riske. Autorid rõhutavad, et kuigi AI-agentid on arenenud paljude tavapäraste ülesannete automatiseerimiseks, on nende jõudluse hindamine „majanduslikult olulistel keskkondadel“ hädavajalik, et mõista, kuidas nad toimivad tootmissüsteemides surve all.

OpenAI märgib, et ootab, et agentic-tehnoloogiad laiendavad maksete ja arvelduste ulatust, sealhulgas stabiilsete müntide kasutamist automaatsetes töövoogudes. Arutelu AI-põhistes maksetes ulatub turvalisuse testimisest kaugemale, küsimusse, kuidas autonoomsed süsteemid osalevad igapäevases finantsaktiviteedis. Ettevõtte enda prognooside kohaselt võivad agentic-maksed muutuda igapäevasemaks, viies AI-võimed praktilistesse kasutusjuhtumitesse, mis puudutavad igapäevaseid tarbijate tehinguid.

Benchmarking-tulemustega paralleelselt on Circle’i tegevjuht Jeremy Allaire avalikult prognoosinud, et miljardid AI-agentid võivad järgmise viie aasta jooksul teha igapäevaseid makseid stabiilsete müntidega. See seisukoht kattub krüptovaldkonna korduvate teemadega: krüpto võib muutuda AI-agentide loomulikuks valuutaks – narratiiv, mis on pälvinud märkimisväärset tähelepanu nii tööstuse juhtide kui ka investorite seas. Kuigi sellised ennustused on veel spekulatiivsed, on alusnähtus selge – AI-automaatika liigub laboritest tehingu kihtideni, kus see võib muuta viisi, kuidas väärtused võrgustikes liiguvad.

Uuring ilmub ajal, mil krüptoturvalisus on endiselt investorite jaoks oluline riskifaktor. Andmed 2025. aasta krüptorahade rünnakute kohta – ründajad võtsid ligi 3,4 miljardit dollarit – rõhutavad paremate tööriistade ja kiiremate, usaldusväärsemate parandusmeetodite vajadust. EVMbench-raamistik on osaliselt mõeldud võimaluseks hinnata, kas AI-agentid suudavad mastaabis panustada kaitsevõimetesse, vähendades ekspluateerimisvõimalusi ja kiirendades ohu leevendamist.

Benchmarki loomiseks võtsid uurijad kasutusele 120 valitud nõrkust, mis hõlmasid 40 nutika lepingu auditi tulemusi, kusjuures paljud nõrkused pärinesid avatud allikate auditikonkurssidelt. OpenAI väidab, et benchmark aitab jälgida AI-tehnoloogiate edusammusid lepingutasemel nõrkuste tuvastamises ja leevendamises mastaabis, pakkudes standardiseeritud viisi, kuidas võrrelda tulevasi AI-mudeleid nende arengu käigus. Uuring pakub ka perspektiivi, kuidas AI-d võib rakendada riskianalüüsi normaliseerimiseks laias nutikate lepingute arhitektuurides, keskendudes mitte ainult üksikute juhtumitele.

Nutikad lepingud ei ole loodud inimeste jaoks: Dragonfly

X-s avaldatud paralleelses teemas argumenteeris Dragonfly partner Haseeb Qureshi, et krüptode lubadus asendada omandiõigusi ja traditsioonilisi lepinguid ei realiseerunud mitte seetõttu, et tehnoloogia ebaõnnestus, vaid sellepärast, et seda ei disainitud kunagi inimliku intuitsiooni arvestamiseks. Ta on rõhutanud püsivat kartust, mis kaasneb suurte tehingute allkirjastamisega keskkonnas, kus drainer-walletid ja muud rünnakuvektorid on pidevaks ohuks, erinedes selgelt traditsiooniliste pangakontode ülekannete võrreldes, mis on võrreldes selle keerukusega üsna sujuvad.

Qureshi väidab, et krüptotehingute järgmist faasi võivad võimaldada AI-vahendatud, iseliikuvad rahakotid. Sellised rahakotid jälgivad riske, haldavad keerukaid operatsioone ja reageerivad autonoomselt ohtudele kasutajate eest, vähendades potentsiaalselt hõredust ja hirmu, mis iseloomustavad tänapäeva suuri ülekandeid.

Selle teema laiem järeldus on, et AI-agentid võivad mängida kriitilist rolli inimeste krüptoga suhtlemise muutmises – liikudes manuaalsetest, veaküllastest tehingutest automatiseeritud, riskiteadlike protsesside poole, mis võivad kasutuselevõtu korral skaleeruda. Kui AI-agentid hakkavad demonstreerima suuremat pädevust turvariskide käsitlemisel, võivad kasutajad näha dezentraliseeritud finantstöövoo paremat usaldusväärsust ja vastupidavust, isegi kui aluslikud tehnoloogiad jätkuvalt areneda.

Mida jälgida edaspidi

  • EVMbenchi täieliku andmekogumi avaldamine ja sõltumatu replikeerimine lisades AI-mudelite ja -arhitektuuridega.
  • AI-assisteeritud auditeerimisprotsesside laiem kasutamine audiitoritel, börsidel ja DeFi-projektidel, kes soovivad tugevdada oma turvakontseptsioone.
  • Uuringud agentic-rahakottide ja autonoomsete maksevoogude kohta, sealhulgas regulatiivsed ja nõuetekohased kaalutlused AI-hallatavate varade jaoks.
  • Järelmeetmeid benchmarkingud, mis võrdlevad uusi AI-süsteeme uute versioonide väljaandmisel, jälgides paranduste täpsust ja parandamise kiirust.

Allikad ja kinnitused

  • OpenAI: EVMbench: AI-agentide hindamine nutikate lepingute turvalisuses — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
  • OpenAI: EVMbench tutvustus — https://openai.com/index/introducing-evmbench/
  • Krüptoturvalisuse kaotused 2025. aastal (aruandluskajastus): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
  • Dragonfly: Haseeb Qureshi AI-st ja krüptoturvalisuse kasutajakogemusest (X-postitus): https://x.com/hosseeb/status/2024136762424185208
  • Hiina AI-edu ja krüptoturvalisuse mõjud (analüüs): https://cointelegraph.com/news/china-ai-lead-future
  • AI Eye — IronClaw ja AI-botide areng Polymarketis: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Põhilised numbrid ja järgmised sammud

EVMbench-uuring näitab, et suured keelemodelid ja nendega seotud AI-agentid hakkavad nutikate lepingute ruumis tegema tähendusrikast turvategevust, millel on mudelite vahel selgelt kvantifitseeritavad erinevused. Claude Opus 4.6 juhtimine keskmiste detekteerimisauhindade poolest viitab, et teatud arhitektuurid võivad olla võimekamad keerukate lepingulogikate nõrkuste leidmisel ja leevendamisel, samas kui teised jäävad tahapoole, pakkudes spektrit võimeid, mida uurijad tõenäoliselt soovivad täpsustada. Projektis osalenud mitmete tööstuspartnerluste lisamine rõhutab kasvavat üksmeelt, et AI-toega turvalisus ja automatiseeritud riskijuhtimine võivad muutuda dezentraliseeritud keskkondades mastaabis vajalikuks.

Kui valdkond edasi areneb, jälgivad vaatlejad, kui kiiresti suudavad AI-agentid liikuda detekteerimisest parandamiseni ning kas need agentid suudavad töötada usaldusväärselt elavates süsteemides, ilma uusi riske lisamata. Arutelu AI-põhistest rahakottidest ja autonoomsetest maksetest puudutab laiemat komplekti küsimusi turvakujunduse, kasutajate nõusoleku ja regulatiivse kooskõla kohta. Kui OpenAI ja tema partnerite poolt välja pakutud trajektoor jätkub, võivad AI-assisteeritud tööriistad muutuda tulevase krüptoinfrastruktuuri põhikomponentideks, muutes nii riskikalkulatsiooni kui ka kasutajakogemust märkimisväärselt. Järgmine benchmarkinguring, koos reaalsete rakendustega, aitab kindlaks teha, kui kiiresti see visioon realiseerub ja millised kaitsemeetmed sellele kaasas peavad tulema.

Selle artikli algne versioon ilmus “OpenAI võistleb AI-agentidega, et red-teamida nutikaid lepinguid” Crypto Breaking News’is – teie usaldusväärne allikas krüptouudiste, Bitcoin-uudiste ja blockchaini uuenduste jaoks.

Turuvõimalus
Smart Blockchain logo
Smart Blockchain hind(SMART)
$0.005195
$0.005195$0.005195
+2.97%
USD
Smart Blockchain (SMART) reaalajas hinnagraafik
Lahtiütlus: Sellel saidil taasavaldatud artiklid pärinevad avalikelt platvormidelt ja on esitatud ainult informatiivsel eesmärgil. Need ei kajasta tingimata MEXC seisukohti. Kõik õigused jäävad algsetele autoritele. Kui arvate, et sisu rikub kolmandate isikute õigusi, võtke selle eemaldamiseks ühendust aadressil crypto.news@mexc.com. MEXC ei garanteeri sisu täpsust, täielikkust ega ajakohasust ega vastuta esitatud teabe põhjal võetud meetmete eest. Sisu ei ole finants-, õigus- ega muu professionaalne nõuanne ega seda tohiks pidada MEXC soovituseks ega toetuseks.

$30,000 in PRL + 15,000 USDT

$30,000 in PRL + 15,000 USDT$30,000 in PRL + 15,000 USDT

Deposit & trade PRL to boost your rewards!