Tiêu chuẩn đánh giá mới đánh giá khả năng phát hiện, vá lỗi và khai thác lỗ hổng hợp đồng thông minh của AI Agent. GPT-5.3-Codex đạt 72,2% trong các nhiệm vụ khai thác. (Đọc thêmTiêu chuẩn đánh giá mới đánh giá khả năng phát hiện, vá lỗi và khai thác lỗ hổng hợp đồng thông minh của AI Agent. GPT-5.3-Codex đạt 72,2% trong các nhiệm vụ khai thác. (Đọc thêm

OpenAI và Paradigm Ra mắt EVMbench để Kiểm tra Khả năng Tấn công Hợp đồng Thông minh của AI

2026/03/05 08:55
Đọc trong 4 phút
Đối với phản hồi hoặc thắc mắc liên quan đến nội dung này, vui lòng liên hệ với chúng tôi qua crypto.news@mexc.com

OpenAI và Paradigm Ra mắt EVMbench để Kiểm tra AI Agent Tấn công Hợp đồng thông minh

Rongchai Wang 00:55 05/03/2026 (Giờ VN)

Tiêu chuẩn mới đánh giá khả năng phát hiện, vá lỗi và khai thác lỗ hổng hợp đồng thông minh của AI Agent. GPT-5.3-Codex đạt 72,2% trong các nhiệm vụ khai thác.

OpenAI và Paradigm Ra mắt EVMbench để Kiểm tra AI Agent Tấn công Hợp đồng thông minh

OpenAI và công ty đầu tư tiền mã hoá Paradigm đã phát hành EVMbench, một tiêu chuẩn đo lường mức độ hiệu quả của AI Agent trong việc tìm kiếm, sửa chữa và khai thác các lỗ hổng trong hợp đồng thông minh Ethereum blockchain. Thông báo này được đưa ra khi các công cụ bảo mật được hỗ trợ bởi AI đang chạy đua để bảo vệ hơn 100 tỷ USD bị khóa trong các giao thức DeFi(Decentralized Finance).

Tiêu chuẩn này rút ra từ 120 lỗ hổng mức độ nghiêm trọng cao được tuyển chọn từ 40 cuộc kiểm toán bảo mật thực tế, chủ yếu từ các cuộc thi Code4rena. Nó cũng bao gồm các kịch bản lỗ hổng từ Đánh giá bảo mật của Tempo, một blockchain Layer 1 được xây dựng cho các khoản thanh toán stablecoin.

Ba Cách để Phá vỡ Hợp đồng thông minh

EVMbench kiểm tra AI Agent qua ba chế độ khác biệt. Trong chế độ Phát hiện, các AI Agent kiểm toán kho lưu trữ hợp đồng và được chấm điểm dựa trên việc tìm ra các lỗ hổng đã biết. Chế độ Vá lỗi yêu cầu các AI Agent sửa mã dễ bị tấn công mà không làm hỏng chức năng hiện có. Chế độ Khai thác là tích cực nhất—các AI Agent phải thực hiện các cuộc tấn công rút cạn quỹ thực tế chống lại các hợp đồng được triển khai trên blockchain sandbox.

Kết quả cho thấy khả năng AI đang tiến bộ nhanh chóng trong lĩnh vực này. GPT-5.3-Codex chạy qua Codex CLI đạt tỷ lệ thành công 72,2% trong các nhiệm vụ khai thác. Con số này cao gấp hơn hai lần so với điểm 31,9% của GPT-5, được ra mắt chỉ sáu tháng trước đó.

Điều thú vị là AI Agent hoạt động tốt hơn trong việc tấn công so với phòng thủ. Thiết lập khai thác có một mục tiêu rõ ràng—tiếp tục lặp lại cho đến khi bạn rút cạn quỹ. Phát hiện và vá lỗi tỏ ra khó khăn hơn. Các AI Agent đôi khi dừng lại sau khi tìm thấy một lỗi thay vì kiểm toán một cách toàn diện, và việc duy trì đầy đủ chức năng hợp đồng trong khi loại bỏ các lỗ hổng tinh vi vẫn còn là thách thức.

Hạn chế Thực tế Đáng Lưu ý

OpenAI thừa nhận EVMbench không nắm bắt được toàn bộ độ khó của bảo mật hợp đồng trong thế giới thực. Các giao thức được triển khai rộng rãi như Uniswap hoặc Aave trải qua sự giám sát nhiều hơn rất nhiều so với mã cuộc thi kiểm toán. Tiêu chuẩn này cũng không thể xác minh liệu một AI Agent có tìm thấy các lỗ hổng hợp pháp mà kiểm toán viên con người bỏ lỡ hay không—nó chỉ kiểm tra dựa trên các vấn đề đã biết.

Môi trường khai thác chạy trên một phiên bản Anvil cục bộ sạch thay vì trạng thái mainnet được fork, và các cuộc tấn công phụ thuộc vào thời gian nằm ngoài phạm vi. Chỉ có môi trường chuỗi đơn hiện tại.

10 triệu USD cho Nghiên cứu Phòng thủ

Cùng với EVMbench, OpenAI cam kết 10 triệu USD tín dụng Khoá API dành riêng cho nghiên cứu bảo mật phòng thủ. Công ty đang mở rộng AI Agent nghiên cứu bảo mật Aardvark của mình cho nhiều người dùng hơn và hợp tác với những người duy trì mã nguồn mở để quét cơ sở mã miễn phí.

Thời điểm này rất quan trọng. Khi AI Agent ngày càng giỏi hơn trong việc khai thác hợp đồng, khoảng thời gian giữa phát hiện lỗ hổng và khai thác ngày càng thu hẹp. Các nhóm giao thức không sử dụng kiểm toán được hỗ trợ bởi AI sẽ ngày càng thấy mình ở thế bất lợi trước những kẻ tấn công đang sử dụng.

OpenAI đã phát hành công khai các nhiệm vụ, công cụ và khung đánh giá của EVMbench. Đối với các nhà phát triển DeFi(Decentralized Finance) và các nhà nghiên cứu bảo mật, đây vừa là thước đo vừa là cảnh báo về hướng đi của khả năng AI Agent.

Nguồn hình ảnh: Shutterstock
  • openai
  • paradigm
  • hợp đồng thông minh
  • bảo mật ai
  • defi
Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ crypto.news@mexc.com để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.