OpenAI và Paradigm Ra mắt EVMbench để Kiểm tra AI Agent Tấn công Hợp đồng thông minh

Rongchai Wang 00:55 05/03/2026 (Giờ VN)

Tiêu chuẩn mới đánh giá khả năng phát hiện, vá lỗi và khai thác lỗ hổng hợp đồng thông minh của AI Agent. GPT-5.3-Codex đạt 72,2% trong các nhiệm vụ khai thác.

OpenAI và Paradigm Ra mắt EVMbench để Kiểm tra AI Agent Tấn công Hợp đồng thông minh

OpenAI và công ty đầu tư tiền mã hoá Paradigm đã phát hành EVMbench, một tiêu chuẩn đo lường mức độ hiệu quả của AI Agent trong việc tìm kiếm, sửa chữa và khai thác các lỗ hổng trong hợp đồng thông minh Ethereum blockchain. Thông báo này được đưa ra khi các công cụ bảo mật được hỗ trợ bởi AI đang chạy đua để bảo vệ hơn 100 tỷ USD bị khóa trong các giao thức DeFi（Decentralized Finance）.

Tiêu chuẩn này rút ra từ 120 lỗ hổng mức độ nghiêm trọng cao được tuyển chọn từ 40 cuộc kiểm toán bảo mật thực tế, chủ yếu từ các cuộc thi Code4rena. Nó cũng bao gồm các kịch bản lỗ hổng từ Đánh giá bảo mật của Tempo, một blockchain Layer 1 được xây dựng cho các khoản thanh toán stablecoin.

Ba Cách để Phá vỡ Hợp đồng thông minh

EVMbench kiểm tra AI Agent qua ba chế độ khác biệt. Trong chế độ Phát hiện, các AI Agent kiểm toán kho lưu trữ hợp đồng và được chấm điểm dựa trên việc tìm ra các lỗ hổng đã biết. Chế độ Vá lỗi yêu cầu các AI Agent sửa mã dễ bị tấn công mà không làm hỏng chức năng hiện có. Chế độ Khai thác là tích cực nhất—các AI Agent phải thực hiện các cuộc tấn công rút cạn quỹ thực tế chống lại các hợp đồng được triển khai trên blockchain sandbox.

Kết quả cho thấy khả năng AI đang tiến bộ nhanh chóng trong lĩnh vực này. GPT-5.3-Codex chạy qua Codex CLI đạt tỷ lệ thành công 72,2% trong các nhiệm vụ khai thác. Con số này cao gấp hơn hai lần so với điểm 31,9% của GPT-5, được ra mắt chỉ sáu tháng trước đó.

Điều thú vị là AI Agent hoạt động tốt hơn trong việc tấn công so với phòng thủ. Thiết lập khai thác có một mục tiêu rõ ràng—tiếp tục lặp lại cho đến khi bạn rút cạn quỹ. Phát hiện và vá lỗi tỏ ra khó khăn hơn. Các AI Agent đôi khi dừng lại sau khi tìm thấy một lỗi thay vì kiểm toán một cách toàn diện, và việc duy trì đầy đủ chức năng hợp đồng trong khi loại bỏ các lỗ hổng tinh vi vẫn còn là thách thức.

Hạn chế Thực tế Đáng Lưu ý

OpenAI thừa nhận EVMbench không nắm bắt được toàn bộ độ khó của bảo mật hợp đồng trong thế giới thực. Các giao thức được triển khai rộng rãi như Uniswap hoặc Aave trải qua sự giám sát nhiều hơn rất nhiều so với mã cuộc thi kiểm toán. Tiêu chuẩn này cũng không thể xác minh liệu một AI Agent có tìm thấy các lỗ hổng hợp pháp mà kiểm toán viên con người bỏ lỡ hay không—nó chỉ kiểm tra dựa trên các vấn đề đã biết.

Môi trường khai thác chạy trên một phiên bản Anvil cục bộ sạch thay vì trạng thái mainnet được fork, và các cuộc tấn công phụ thuộc vào thời gian nằm ngoài phạm vi. Chỉ có môi trường chuỗi đơn hiện tại.

10 triệu USD cho Nghiên cứu Phòng thủ

Cùng với EVMbench, OpenAI cam kết 10 triệu USD tín dụng Khoá API dành riêng cho nghiên cứu bảo mật phòng thủ. Công ty đang mở rộng AI Agent nghiên cứu bảo mật Aardvark của mình cho nhiều người dùng hơn và hợp tác với những người duy trì mã nguồn mở để quét cơ sở mã miễn phí.

Thời điểm này rất quan trọng. Khi AI Agent ngày càng giỏi hơn trong việc khai thác hợp đồng, khoảng thời gian giữa phát hiện lỗ hổng và khai thác ngày càng thu hẹp. Các nhóm giao thức không sử dụng kiểm toán được hỗ trợ bởi AI sẽ ngày càng thấy mình ở thế bất lợi trước những kẻ tấn công đang sử dụng.

OpenAI đã phát hành công khai các nhiệm vụ, công cụ và khung đánh giá của EVMbench. Đối với các nhà phát triển DeFi（Decentralized Finance） và các nhà nghiên cứu bảo mật, đây vừa là thước đo vừa là cảnh báo về hướng đi của khả năng AI Agent.

Nguồn hình ảnh: Shutterstock

openai
paradigm
hợp đồng thông minh
bảo mật ai
defi

OpenAI và Paradigm Ra mắt EVMbench để Kiểm tra Khả năng Tấn công Hợp đồng Thông minh của AI

OpenAI và Paradigm Ra mắt EVMbench để Kiểm tra AI Agent Tấn công Hợp đồng thông minh

Ba Cách để Phá vỡ Hợp đồng thông minh

Hạn chế Thực tế Đáng Lưu ý

10 triệu USD cho Nghiên cứu Phòng thủ

Có thể bạn cũng thích

Vụ trộm Bitcoin Queenbee Coin: Chi tiết gây sốc từ cuộc điều tra của Cảnh sát Seoul

Ông Trump nhấn mạnh tầm quan trọng của việc Mỹ dẫn đầu trong lĩnh vực tiền điện tử

Solana lập kỷ lục 650 tỷ USD giao dịch stablecoin trong tháng 2

Tin tức xu hướng

Vụ trộm Bitcoin Queenbee Coin: Chi tiết gây sốc từ cuộc điều tra của Cảnh sát Seoul

Ông Trump nhấn mạnh tầm quan trọng của việc Mỹ dẫn đầu trong lĩnh vực tiền điện tử

Solana lập kỷ lục 650 tỷ USD giao dịch stablecoin trong tháng 2

Ethereum (ETH) hồi phục cùng OI kỷ lục: Thị trường đang kỳ vọng điều gì?

Tấn Công Đầu Độc Địa Chỉ Tàn Phá Influencer Tiền Mã Hóa: 24 Triệu USD Bị Đánh Cắp Trong Vụ Lừa Đảo Tinh Vi

Đọc nhanh

CLAWSTR Crypto là gì? Giới thiệu về Tiền điện tử CLAWSTR

Autism Coin (AUTISM) là gì? Giới thiệu về Tiền điện tử

HODL Coin (HODL) là gì? Giới thiệu về tiền điện tử

Milady Token MILADY là gì? Giới thiệu về tiền điện tử

Archer Aviation Tokenized Stock (ACHRON) là gì? Giới thiệu về Tiền điện tử

Giá tiền mã hoá