OpenAI on avaldanud benchmarking-raamistiku, mille eesmärk on hinnata, kui efektiivselt suudavad AI-agentid tuvastada, leevendada ja isegi ära kasutada turvariskidega seotud nõrkusi krüptosidest nutikates lepingutes. Projekti pealkiri „EVMbench: AI-agentide hindamine nutikate lepingute turvalisuses“ sai avaldatud koostöös Paradigmi ja OtterSeciga – kahe organisatsiooniga, kes on sügavalt pühendunud blockchaini turvalisusele ja investeeringutele. Uuringu käigus hinnatakse AI-agentide võimeid 120 valitud nõrkuse vastu, mis on pärinevad 40 nutika lepingu auditi tulemustest, püüdes mitte ainult kvantifitseerida nende detekteerimis- ja parandamisvõimeid, vaid ka hinnata nende agentide teoreetilist ekspluateerimisvõimalust kontrollitud keskkonnas.
AI-agentide detekteerimisauhindu kirjeldatakse OpenAI uuringuga kaasnevas PDF-failis, kus samuti selgitatakse hindamismetoodikat ja stsenaariume, mille abil simuleeritakse reaalseid nutikate lepingute riske. Autorid rõhutavad, et kuigi AI-agentid on arenenud paljude tavapäraste ülesannete automatiseerimiseks, on nende jõudluse hindamine „majanduslikult olulistel keskkondadel“ hädavajalik, et mõista, kuidas nad toimivad tootmissüsteemides surve all.
OpenAI märgib, et ootab, et agentic-tehnoloogiad laiendavad maksete ja arvelduste ulatust, sealhulgas stabiilsete müntide kasutamist automaatsetes töövoogudes. Arutelu AI-põhistes maksetes ulatub turvalisuse testimisest kaugemale, küsimusse, kuidas autonoomsed süsteemid osalevad igapäevases finantsaktiviteedis. Ettevõtte enda prognooside kohaselt võivad agentic-maksed muutuda igapäevasemaks, viies AI-võimed praktilistesse kasutusjuhtumitesse, mis puudutavad igapäevaseid tarbijate tehinguid.
Benchmarking-tulemustega paralleelselt on Circle’i tegevjuht Jeremy Allaire avalikult prognoosinud, et miljardid AI-agentid võivad järgmise viie aasta jooksul teha igapäevaseid makseid stabiilsete müntidega. See seisukoht kattub krüptovaldkonna korduvate teemadega: krüpto võib muutuda AI-agentide loomulikuks valuutaks – narratiiv, mis on pälvinud märkimisväärset tähelepanu nii tööstuse juhtide kui ka investorite seas. Kuigi sellised ennustused on veel spekulatiivsed, on alusnähtus selge – AI-automaatika liigub laboritest tehingu kihtideni, kus see võib muuta viisi, kuidas väärtused võrgustikes liiguvad.
Uuring ilmub ajal, mil krüptoturvalisus on endiselt investorite jaoks oluline riskifaktor. Andmed 2025. aasta krüptorahade rünnakute kohta – ründajad võtsid ligi 3,4 miljardit dollarit – rõhutavad paremate tööriistade ja kiiremate, usaldusväärsemate parandusmeetodite vajadust. EVMbench-raamistik on osaliselt mõeldud võimaluseks hinnata, kas AI-agentid suudavad mastaabis panustada kaitsevõimetesse, vähendades ekspluateerimisvõimalusi ja kiirendades ohu leevendamist.
Benchmarki loomiseks võtsid uurijad kasutusele 120 valitud nõrkust, mis hõlmasid 40 nutika lepingu auditi tulemusi, kusjuures paljud nõrkused pärinesid avatud allikate auditikonkurssidelt. OpenAI väidab, et benchmark aitab jälgida AI-tehnoloogiate edusammusid lepingutasemel nõrkuste tuvastamises ja leevendamises mastaabis, pakkudes standardiseeritud viisi, kuidas võrrelda tulevasi AI-mudeleid nende arengu käigus. Uuring pakub ka perspektiivi, kuidas AI-d võib rakendada riskianalüüsi normaliseerimiseks laias nutikate lepingute arhitektuurides, keskendudes mitte ainult üksikute juhtumitele.
X-s avaldatud paralleelses teemas argumenteeris Dragonfly partner Haseeb Qureshi, et krüptode lubadus asendada omandiõigusi ja traditsioonilisi lepinguid ei realiseerunud mitte seetõttu, et tehnoloogia ebaõnnestus, vaid sellepärast, et seda ei disainitud kunagi inimliku intuitsiooni arvestamiseks. Ta on rõhutanud püsivat kartust, mis kaasneb suurte tehingute allkirjastamisega keskkonnas, kus drainer-walletid ja muud rünnakuvektorid on pidevaks ohuks, erinedes selgelt traditsiooniliste pangakontode ülekannete võrreldes, mis on võrreldes selle keerukusega üsna sujuvad.
Qureshi väidab, et krüptotehingute järgmist faasi võivad võimaldada AI-vahendatud, iseliikuvad rahakotid. Sellised rahakotid jälgivad riske, haldavad keerukaid operatsioone ja reageerivad autonoomselt ohtudele kasutajate eest, vähendades potentsiaalselt hõredust ja hirmu, mis iseloomustavad tänapäeva suuri ülekandeid.
Selle teema laiem järeldus on, et AI-agentid võivad mängida kriitilist rolli inimeste krüptoga suhtlemise muutmises – liikudes manuaalsetest, veaküllastest tehingutest automatiseeritud, riskiteadlike protsesside poole, mis võivad kasutuselevõtu korral skaleeruda. Kui AI-agentid hakkavad demonstreerima suuremat pädevust turvariskide käsitlemisel, võivad kasutajad näha dezentraliseeritud finantstöövoo paremat usaldusväärsust ja vastupidavust, isegi kui aluslikud tehnoloogiad jätkuvalt areneda.
EVMbench-uuring näitab, et suured keelemodelid ja nendega seotud AI-agentid hakkavad nutikate lepingute ruumis tegema tähendusrikast turvategevust, millel on mudelite vahel selgelt kvantifitseeritavad erinevused. Claude Opus 4.6 juhtimine keskmiste detekteerimisauhindade poolest viitab, et teatud arhitektuurid võivad olla võimekamad keerukate lepingulogikate nõrkuste leidmisel ja leevendamisel, samas kui teised jäävad tahapoole, pakkudes spektrit võimeid, mida uurijad tõenäoliselt soovivad täpsustada. Projektis osalenud mitmete tööstuspartnerluste lisamine rõhutab kasvavat üksmeelt, et AI-toega turvalisus ja automatiseeritud riskijuhtimine võivad muutuda dezentraliseeritud keskkondades mastaabis vajalikuks.
Kui valdkond edasi areneb, jälgivad vaatlejad, kui kiiresti suudavad AI-agentid liikuda detekteerimisest parandamiseni ning kas need agentid suudavad töötada usaldusväärselt elavates süsteemides, ilma uusi riske lisamata. Arutelu AI-põhistest rahakottidest ja autonoomsetest maksetest puudutab laiemat komplekti küsimusi turvakujunduse, kasutajate nõusoleku ja regulatiivse kooskõla kohta. Kui OpenAI ja tema partnerite poolt välja pakutud trajektoor jätkub, võivad AI-assisteeritud tööriistad muutuda tulevase krüptoinfrastruktuuri põhikomponentideks, muutes nii riskikalkulatsiooni kui ka kasutajakogemust märkimisväärselt. Järgmine benchmarkinguring, koos reaalsete rakendustega, aitab kindlaks teha, kui kiiresti see visioon realiseerub ja millised kaitsemeetmed sellele kaasas peavad tulema.
Selle artikli algne versioon ilmus “OpenAI võistleb AI-agentidega, et red-teamida nutikaid lepinguid” Crypto Breaking News’is – teie usaldusväärne allikas krüptouudiste, Bitcoin-uudiste ja blockchaini uuenduste jaoks.


