BlockSec: AI chưa thể thay thế con người trong kiểm toán smart contract

TapChiBitcoin

Công ty bảo mật BlockSec đã tiến hành kiểm tra lại bộ tiêu chuẩn đánh giá kiểm toán smart contract bằng AI mang tên EVMBench, do OpenAI và Paradigm phát triển. Kết quả cho thấy các bot AI kém hiệu quả hơn đáng kể khi đối mặt với các kịch bản khai thác thực tế.

Nhóm nghiên cứu đã mở rộng môi trường thử nghiệm với nhiều cấu hình mô hình hơn, đồng thời bổ sung các sự cố bảo mật mới xảy ra gần đây — những dữ liệu chưa từng xuất hiện trong tập huấn luyện của các mô hình AI.

Dù AI vẫn chưa thể thay thế các chuyên gia bảo mật, báo cáo nhấn mạnh rằng trí tuệ máy móc có thể đóng vai trò bổ trợ tự nhiên cho quá trình kiểm tra mã của con người.

Kết quả EVMBench ban đầu có thể quá lạc quan

EVMBench trước đó đánh giá các tác vụ bảo mật smart contract như phát hiện, vá lỗi và khai thác lỗ hổng, với kết quả được xem là rất ấn tượng. Theo báo cáo, AI có thể khai thác 72% và phát hiện khoảng 45% lỗ hổng, dựa trên 120 mẫu được chọn lọc từ các cuộc kiểm toán của Code4rena.

Tuy nhiên, BlockSec cho rằng điều kiện thử nghiệm ban đầu có thể đã làm sai lệch kết quả. Đồng sáng lập Yajin Zhou cho biết khi nhóm của ông thử nghiệm lại với nhiều cấu hình hơn và 22 sự cố tấn công thực tế, tỷ lệ khai thác thành công của AI là 0%.

Mở rộng cấu hình và loại bỏ “ô nhiễm dữ liệu”

Nghiên cứu đã tăng số cấu hình mô hình từ 14 lên 26 bằng cách kết hợp linh hoạt các bot với nhiều “scaffold” khác nhau, thay vì chỉ giới hạn trong hệ sinh thái của từng nhà cung cấp. Theo nhóm nghiên cứu, cách làm cũ khiến khó phân biệt hiệu suất đến từ năng lực mô hình hay lợi thế kiến trúc.

Ngoài ra, BlockSec cũng đặt nghi vấn về hiện tượng “ô nhiễm dữ liệu”, khi EVMBench sử dụng các lỗ hổng đã được công bố trước đó — có khả năng đã nằm trong dữ liệu huấn luyện của AI. Để khắc phục, nhóm đã thử nghiệm trên 22 sự cố bảo mật xảy ra sau tháng 2/2026, nằm ngoài “cửa sổ kiến thức” của các mô hình.

AI thất bại hoàn toàn trong khai thác thực tế

Kết quả đáng chú ý nhất: trong 110 cặp thử nghiệm giữa agent và sự cố (5 agent trên 22 tình huống), không có bất kỳ trường hợp khai thác hoàn chỉnh nào thành công. Điều này cho thấy ngay cả các AI tiên tiến nhất hiện nay vẫn còn rất xa mới có thể thực hiện tấn công thực tế.

Tuy vậy, ở mảng phát hiện lỗ hổng, kết quả vẫn tương đối tích cực. Mô hình Claude Opus 4.6 đạt hiệu suất tốt nhất khi phát hiện 13/20 lỗ hổng trong thực tế.

Các lỗ hổng phổ biến, quen thuộc thường được AI phát hiện dễ dàng, nhưng những trường hợp phức tạp hơn thì gần như bị bỏ sót hoàn toàn.

Tương lai là hợp tác giữa AI và con người

Nghiên cứu kết luận rằng AI chưa thể thay thế con người trong kiểm toán bảo mật, và câu hỏi quan trọng hơn là cách hai bên phối hợp hiệu quả.

AI có lợi thế về độ bao phủ và khả năng quét hệ thống quy mô lớn, trong khi con người vượt trội ở tư duy phân tích sâu, hiểu biết giao thức và suy luận đối kháng. Hai yếu tố này mang tính bổ trợ lẫn nhau.

Theo BlockSec, hướng đi đúng đắn không phải là thay thế con người bằng AI, mà là xây dựng mô hình hợp tác giữa hai bên để đạt hiệu quả kiểm toán toàn diện hơn.

Thạch Sanh

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Doanh thu crypto của Robinhood trong quý 1 giảm 47% so với cùng kỳ năm ngoái xuống còn 134 triệu USD

Doanh thu tiền mã hóa và khối lượng giao dịch của Robinhood đã giảm lần lượt khoảng 47% và 48% so với cùng kỳ năm trước trong quý đầu tiên của năm 2026, theo báo cáo kết quả kinh doanh của công ty được công bố vào hôm thứ Ba. Ứng dụng giao dịch phổ biến tại Mỹ đã báo cáo doanh thu tiền mã hóa là $134 milli

CryptoFrontier2giờ trước

Ngành công nghiệp Crypto Đối mặt Làn Sóng Đóng Cửa Khi Mô Hình Token Thất Bại, Thiếu Lối Đi Tái Cơ Cấu

Tin tức Gate, ngày 28 tháng 4 — Ngành công nghiệp crypto đang chứng kiến một làn sóng đóng cửa dự án trong năm nay, ảnh hưởng đến các nền tảng giao dịch, công cụ phân tích và các dịch vụ khác. Dịch vụ email phi tập trung Dmail cho biết chi phí hạ tầng cao, gây quỹ thất bại và tính hữu dụng của token suy yếu là những lý do khiến họ ce

GateNews9giờ trước

Galaxy Digital báo cáo khoản lỗ Q1 $216M khi thị trường crypto giảm 21%; Novogratz lạc quan về tăng trưởng trung tâm dữ liệu

Tin Gate News, ngày 28 tháng 4 — Galaxy Digital báo cáo khoản lỗ ròng $216 triệu đô la trong Q1 2026, chủ yếu do mức giảm khoảng 21% trong vốn hóa thị trường crypto đã gây áp lực lên quỹ dự trữ và các khoản đầu tư của công ty. CEO Mike Novogratz cho rằng các khoản lỗ là do một ngành đang trong giai đoạn chuyển đổi, nói rằng: "Đối với tài sản kỹ thuật số, đây là một năm chuyển đổi — trên toàn cầu, chúng tôi đang chuyển từ một nhóm tài sản mang tính đầu cơ sang một công nghệ sẽ được tích hợp trong mọi ngành nghề trên khắp thế giới."

GateNews10giờ trước

Cổ phiếu công nghệ thúc đẩy đà phục hồi của thị trường; Tài sản crypto và nguồn vốn đầu tư mạo hiểm hồi phục đồng bộ

Tin tức cổng, ngày 28 tháng 4 — Theo báo cáo hằng tuần mới nhất của Gate Ventures, điều kiện kinh tế vĩ mô cho thấy dấu hiệu phục hồi theo từng giai đoạn, với các chỉ số chứng khoán lớn hoạt động không đồng đều nhưng nhìn chung đang đi lên, cho thấy mức độ sẵn sàng chấp nhận rủi ro của thị trường đã được cải thiện. Song song, thị trường crypto đã bật lại, với

GateNews10giờ trước

Các vụ hack tiền mã hóa đã đánh cắp 17,1 tỷ USD trong thập kỷ qua trên 518 vụ việc

Tin tức Gate, ngày 28 tháng 4 — Theo dữ liệu của ChainCatcher, tổng số lỗ lũy kế do các vụ hack tiền mã hóa trong thập kỷ qua đã lên tới 17,1 tỷ USD trên 518 vụ việc. 5 năm gần đây chiếm 15,2 tỷ USD trong số lỗ từ hơn 450 vụ việc, trong khi năm vừa qua ghi nhận khoảng 2,5 tỷ USD bị đánh cắp trên 140+ vụ việc.

GateNews12giờ trước

Block Inc. Công bố Nắm giữ 28,355 BTC Trị giá 2,2 Tỷ USD trong Báo cáo Bằng chứng Dự trữ Quý 1

Tin từ Gate News, ngày 28 tháng 4 — Block Inc., công ty fintech do Jack Dorsey dẫn dắt và là nơi có Square cũng như Cash App, đã công bố báo cáo bằng chứng dự trữ (proof-of-reserves) cho quý 1 vào hôm thứ Hai, tiết lộ tổng lượng bitcoin nắm giữ là 28,355 BTC, trị giá xấp xỉ 2,2 tỷ USD tính đến hết ngày 31 tháng 3 năm 2026. Báo cáo,

GateNews14giờ trước
Bình luận
0/400
Không có bình luận