เกณฑ์มาตรฐานใหม่ประเมินความสามารถของ AI agents ในการตรวจจับ แก้ไข และโจมตีช่องโหว่ของสัญญาอัจฉริยะ GPT-5.3-Codex ได้คะแนน 72.2% ในงานโจมตี (Read Moreเกณฑ์มาตรฐานใหม่ประเมินความสามารถของ AI agents ในการตรวจจับ แก้ไข และโจมตีช่องโหว่ของสัญญาอัจฉริยะ GPT-5.3-Codex ได้คะแนน 72.2% ในงานโจมตี (Read More

OpenAI และ Paradigm เปิดตัว EVMbench เพื่อทดสอบการแฮ็กสัญญาอัจฉริยะด้วย AI

2026/03/05 08:55
1 นาทีในการอ่าน
หากมีข้อเสนอแนะหรือข้อกังวลเกี่ยวกับเนื้อหานี้ โปรดติดต่อเราได้ที่ crypto.news@mexc.com

OpenAI และ Paradigm เปิดตัว EVMbench เพื่อทดสอบการแฮ็กสัญญาอัจฉริยะด้วย AI

Rongchai Wang 05 มี.ค. 2026 00:55

เกณฑ์มาตรฐานใหม่ประเมินความสามารถของตัวแทน AI ในการตรวจจับ แก้ไข และใช้ประโยชน์จากช่องโหว่ของสัญญาอัจฉริยะ GPT-5.3-Codex ทำคะแนนได้ 72.2% ในงานการโจมตี

OpenAI และ Paradigm เปิดตัว EVMbench เพื่อทดสอบการแฮ็กสัญญาอัจฉริยะด้วย AI

OpenAI และบริษัทเวนเจอร์คริปโต Paradigm ได้เปิดตัว EVMbench ซึ่งเป็นเกณฑ์มาตรฐานที่วัดความสามารถของตัวแทน AI ในการค้นหา แก้ไข และใช้ประโยชน์จากช่องโหว่ในสัญญาอัจฉริยะ Ethereum การประกาศนี้เกิดขึ้นในขณะที่เครื่องมือรักษาความปลอดภัยที่ขับเคลื่อนด้วย AI แข่งขันกันเพื่อปกป้องมูลค่ากว่า 100 พันล้านดอลลาร์ที่ถูกล็อกอยู่ในโปรโตคอล DeFi

เกณฑ์มาตรฐานนี้ดึงข้อมูลมาจากช่องโหว่ความรุนแรงสูง 120 รายการที่คัดสรรมาจากการตรวจสอบความปลอดภัยจริง 40 รายการ ส่วนใหญ่มาจากการแข่งขัน Code4rena นอกจากนี้ยังรวมถึงสถานการณ์ช่องโหว่จากการตรวจสอบความปลอดภัยของ Tempo ซึ่งเป็นบล็อกเชน Layer 1 ที่สร้างขึ้นสำหรับการชำระเงินด้วยสเตเบิลคอยน์

สามวิธีในการทำลายสัญญาอัจฉริยะ

EVMbench ทดสอบตัวแทน AI ในสามโหมดที่แตกต่างกัน ในโหมดตรวจจับ ตัวแทนตรวจสอบที่เก็บสัญญาและได้รับคะแนนจากการค้นหาช่องโหว่ที่ทราบแล้ว โหมดแก้ไขต้องการให้ตัวแทนแก้ไขโค้ดที่มีช่องโหว่โดยไม่ทำให้ฟังก์ชันที่มีอยู่เสียหาย โหมดโจมตีเป็นโหมดที่ดุเดือดที่สุด ตัวแทนต้องดำเนินการโจมตีเพื่อถอนเงินจริงต่อสัญญาที่ถูกปรับใช้บนบล็อกเชนแบบแซนด์บ็อกซ์

ผลลัพธ์แสดงให้เห็นว่าความสามารถของ AI กำลังก้าวหน้าอย่างรวดเร็วในสาขานี้ GPT-5.3-Codex ที่ทำงานผ่าน Codex CLI ทำคะแนนความสำเร็จได้ 72.2% ในงานโจมตี นั่นมากกว่าสองเท่าของคะแนน 31.9% จาก GPT-5 ที่เปิดตัวเพียงหกเดือนก่อนหน้านี้

น่าสนใจที่ตัวแทน AI ทำงานด้านการโจมตีได้ดีกว่าการป้องกัน การตั้งค่าโจมตีมีเป้าหมายที่ชัดเจน คือทำซ้ำจนกว่าคุณจะถอนเงินได้ การตรวจจับและการแก้ไขพิสูจน์แล้วว่ายากกว่า บางครั้งตัวแทนหยุดหลังจากพบบั๊กเดียวแทนที่จะตรวจสอบอย่างละเอียดถี่ถ้วน และการรักษาฟังก์ชันสัญญาเต็มรูปแบบในขณะที่กำจัดช่องโหว่ที่ละเอียดอ่อนยังคงเป็นเรื่องที่ท้าทาย

ข้อจำกัดที่แท้จริงที่ควรสังเกต

OpenAI ยอมรับว่า EVMbench ไม่ได้จับความยากลำบากทั้งหมดของความปลอดภัยสัญญาในโลกแห่งความเป็นจริง โปรโตคอลที่ถูกปรับใช้อย่างกว้างขวางเช่น Uniswap หรือ Aave ได้รับการตรวจสอบมากกว่าโค้ดการแข่งขันตรวจสอบมาก เกณฑ์มาตรฐานนี้ยังไม่สามารถยืนยันได้ว่าตัวแทนพบช่องโหว่ที่ถูกต้องตามกฎหมายที่ผู้ตรวจสอบมนุษย์พลาดไป มันเพียงแค่ตรวจสอบกับปัญหาที่ทราบแล้วเท่านั้น

สภาพแวดล้อมการโจมตีทำงานบนอินสแตนซ์ Anvil ในเครื่องที่สะอาดแทนที่จะเป็นสถานะเมนเน็ตที่แยก และการโจมตีที่ขึ้นอยู่กับเวลาอยู่นอกขอบเขต สภาพแวดล้อมเชนเดียวเท่านั้นสำหรับตอนนี้

10 ล้านดอลลาร์สำหรับการวิจัยเชิงป้องกัน

ควบคู่ไปกับ EVMbench OpenAI มุ่งมั่น 10 ล้านดอลลาร์ในเครดิต API โดยเฉพาะสำหรับการวิจัยความปลอดภัยเชิงป้องกัน บริษัทกำลังขยายตัวแทนการวิจัยความปลอดภัย Aardvark ไปยังผู้ใช้มากขึ้นและเป็นพันธมิตรกับผู้ดูแลโอเพนซอร์สสำหรับการสแกนโค้ดเบสฟรี

เวลามีความสำคัญ ในขณะที่ตัวแทน AI ดีขึ้นในการใช้ประโยชน์จากสัญญา หน้าต่างระหว่างการค้นพบช่องโหว่และการใช้ประโยชน์ก็แคบลง ทีมโปรโตคอลที่ไม่ได้ใช้การตรวจสอบที่ช่วยเหลือโดย AI จะพบว่าตัวเองเสียเปรียบมากขึ้นเมื่อเทียบกับผู้โจมตีที่ใช้

OpenAI เปิดตัวงาน เครื่องมือ และกรอบการประเมินของ EVMbench ต่อสาธารณะ สำหรับนักพัฒนา DeFi และนักวิจัยด้านความปลอดภัย มันเป็นทั้งไม้วัดและคำเตือนเกี่ยวกับทิศทางที่ความสามารถของ AI กำลังมุ่งหน้าไป

แหล่งที่มาของภาพ: Shutterstock
  • openai
  • paradigm
  • สัญญาอัจฉริยะ
  • ความปลอดภัย ai
  • defi
โอกาสทางการตลาด
Smart Blockchain โลโก้
ราคา Smart Blockchain(SMART)
$0.004276
$0.004276$0.004276
-0.83%
USD
Smart Blockchain (SMART) กราฟราคาสด
ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ crypto.news@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

ราคา Ethereum แตะระดับ $2,200 เทรดเดอร์เตรียมพร้อมสำหรับการเคลื่อนไหวครั้งถัดไป

ราคา Ethereum แตะระดับ $2,200 เทรดเดอร์เตรียมพร้อมสำหรับการเคลื่อนไหวครั้งถัดไป

ราคา Ethereum เริ่มเพิ่มขึ้นใหม่เหนือ $2,120 ETH กำลังปรับตัวลงจากราคา $2,200 และอาจลดลงต่อไปต่ำกว่า $2,100 Ethereum เริ่มมีแนวโน้มขาลง
แชร์
NewsBTC2026/03/05 11:18
Tom Lee เพิ่มความมั่นใจในขณะที่ BitMine เพิ่มการถือครอง Ethereum เป็น 4.47M ETH

Tom Lee เพิ่มความมั่นใจในขณะที่ BitMine เพิ่มการถือครอง Ethereum เป็น 4.47M ETH

BitMine ซื้อ ETH เพิ่ม 50,900 เหรียญ ยอดถือครองรวมพุ่งเป็น 4.47 ล้าน ETH คิดเป็นประมาณ 3.7% ของอุปทานหมุนเวียนของ Ethereum ประธาน Tom Lee ตั้งเป้าถือครองสูงสุดถึง 5% ของอุปทาน ETH ทั้งหมด
แชร์
LiveBitcoinNews2026/03/05 11:30
แนะนำ YouTrip Split (BETA): แบ่งและชำระเงินทันทีบน YouTrip ได้แล้ว

แนะนำ YouTrip Split (BETA): แบ่งและชำระเงินทันทีบน YouTrip ได้แล้ว

ติดตามค่าใช้จ่ายร่วมกันและจ่ายเงินคืนให้เพื่อนได้ด้วยการแตะเพียงครั้งเดียว! 💰 The post Introducing YouTrip Split (BETA): Split and Settle Instantly on YouTrip Now appeared first
แชร์
You2026/03/05 11:28