BlockSec : L'IA ne peut pas encore remplacer l'homme dans l'audit des contrats intelligents

La société de sécurité BlockSec a réévalué le standard d’audit de contrats intelligents basé sur l’IA, nommé EVMBench, développé par OpenAI et Paradigm. Les résultats montrent que les bots IA sont nettement moins efficaces face à des scénarios d’exploitation réels.

L’équipe de recherche a élargi l’environnement de test avec davantage de configurations de modèles, tout en ajoutant de nouveaux incidents de sécurité récents — des données jamais rencontrées lors de la formation des modèles d’IA.

Bien que l’IA ne puisse pas encore remplacer les experts en sécurité, le rapport souligne que l’intelligence artificielle peut jouer un rôle complémentaire naturel dans le processus de vérification du code par l’humain.

Les résultats initiaux d’EVMBench peuvent être trop optimistes

EVMBench évaluait auparavant des tâches de sécurité des contrats intelligents telles que la détection, la correction et l’exploitation de vulnérabilités, avec des résultats jugés très impressionnants. Selon le rapport, l’IA pouvait exploiter 72 % et détecter environ 45 % des vulnérabilités, sur 120 échantillons sélectionnés parmi les audits de Code4rena.

Cependant, BlockSec pense que les conditions initiales de test ont pu fausser les résultats. Yajin Zhou, cofondateur, indique que lors de ses essais avec plus de configurations et 22 incidents d’attaque réels, le taux de succès d’exploitation par l’IA était de 0 %.

Extension des configurations et élimination de la “contamination des données”

L’étude a augmenté le nombre de configurations de modèles de 14 à 26 en combinant de manière flexible des bots avec plusieurs “échafaudages” différents, plutôt que de se limiter à l’écosystème d’un seul fournisseur. Selon l’équipe, la méthode précédente rendait difficile de distinguer si la performance venait de la capacité du modèle ou de l’architecture.

De plus, BlockSec remet en question le phénomène de “contamination des données”, lorsque EVMBench utilise des vulnérabilités déjà publiées — qui pourraient avoir été incluses dans les données d’entraînement de l’IA. Pour y remédier, l’équipe a testé 22 incidents de sécurité survenus après février 2026, hors de la “fenêtre de connaissance” des modèles.

L’IA échoue totalement dans l’exploitation en conditions réelles

Le résultat le plus marquant : sur 110 essais entre agents et incidents (5 agents sur 22 situations), aucune exploitation complète n’a abouti avec succès. Cela montre que même les IA les plus avancées aujourd’hui sont encore très loin de pouvoir réaliser des attaques en conditions réelles.

Cependant, en détection de vulnérabilités, les résultats restent relativement positifs. Le modèle Claude Opus 4.6 a obtenu la meilleure performance en détectant 13 vulnérabilités sur 20 en situation réelle.

Les vulnérabilités courantes et familières sont généralement facilement détectées par l’IA, mais les cas plus complexes sont presque totalement ignorés.

L’avenir réside dans la collaboration entre IA et humains

L’étude conclut que l’IA ne peut pas encore remplacer l’humain dans l’audit de sécurité, et la question cruciale est de savoir comment les deux parties peuvent coopérer efficacement.

L’IA a l’avantage d’une couverture étendue et d’une capacité à scanner de grands systèmes, tandis que l’humain excelle dans la réflexion analytique approfondie, la compréhension des protocoles et le raisonnement antagoniste. Ces deux éléments se complètent.

Selon BlockSec, la voie à suivre n’est pas de remplacer l’humain par l’IA, mais de construire un modèle de collaboration entre les deux pour atteindre un audit plus complet.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Sondage : 36 % des traders crypto réduisent leurs dépenses face au ralentissement du marché, mais 79 % prévoient de conserver ou d’augmenter leurs avoirs

Message de Gate News, 27 avril — Une enquête auprès de 1 100 utilisateurs actifs sur un grand CEX a révélé que 36 % des traders crypto américains ont réduit leurs dépenses quotidiennes en raison du ralentissement actuel du marché. Parmi eux, 10 % ont décrit cela comme un sacrifice majeur pour maintenir leurs positions, tandis que 37 % ont retardé ou annulé des achats importants en raison de pertes crypto. En outre, 38 % des traders ont déclaré avoir subi une certaine forme de perturbation financière depuis octobre 2025. Un quart des répondants a indiqué qu’il s’appuie sur ses économies pour maintenir la stabilité financière, et 12 % ont admis avoir manqué des paiements ou les avoir retardés. Malgré ces pressions, la majorité des traders reste optimiste : 79 % prévoient de conserver ou d’augmenter leurs positions au cours des six prochains mois.

GateNewsIl y a 40m

Les 30 partenaires Web3 de Fireblocks gèrent plus de $200B pour les flux mensuels de stablecoins

Message de Gate News, 26 avril — Fireblocks, une plateforme de transfert d’actifs à destination des institutions de premier plan, exploite un réseau de 30 partenaires commerciaux Web3 couvrant des protocoles DeFi, le règlement des paiements, l’analyse de la conformité, des institutions de trading et une infrastructure multi-chaînes. L’écosystème de partenariat est

GateNewsIl y a 17h

Le chiffre d’affaires du T1 de Moore Threads bondit de 155% d’une année sur l’autre pour atteindre 104 M$, et l’entreprise redevient rentable

Message de Gate News, 26 avril — Moore Threads a annoncé un chiffre d’affaires du premier trimestre 2026 de 738 millions de yuans (environ $104 millions), soit une hausse de 155,35% d’une année sur l’autre. L’entreprise est redevenue rentable avec un bénéfice net de 29,36 millions de yuans, contre une perte de 112 millions de yuans dans le sa

GateNewsIl y a 18h

Les stablecoins, ce n’est pas seulement pour les paiements transfrontaliers, mais aussi pour l’ancrage local ! Rapport récent d’a16z : l’Asie représente les deux tiers du volume de transactions

Le géant du capital-risque crypto a16z vient de publier le rapport « 9 charts on what stablecoins are becoming », qui, à travers neuf graphiques clés, décrit le changement structurel en cours concernant les stablecoins. La conclusion centrale de ce rapport n’est pas une nouvelle monnaie ou un nouveau récit, mais plutôt l’évolution du rôle des stablecoins : ils passent d’un « outil de transaction », d’un « support d’épargne » à une « infrastructure financière fondamentale », et ils deviennent de plus en plus localisés, avec un écart évident par rapport aux anticipations initiales du marché concernant les paiements transfrontaliers. La loi américaine GENIUS Act propulse le volume de transactions des stablecoins à 4,5 billions de dollars au quatrième trimestre Au cours de ces dernières années, l’incertitude réglementaire a constamment constitué un plafond pour la participation institutionnelle aux stablecoins. Le point d’inflexion vient de l’adoption par le GENIUS Act américain, qui établit le premier cadre fédéral de réglementation pour l’émission de stablecoins. D’après les données de a16z, le volume de transactions des stablecoins, après ajustement, avait déjà enregistré plusieurs trimestres consécutifs avant le vote du projet de loi, sur

ChainNewsAbmediaIl y a 19h

Banque centrale du Brésil : les stablecoins dominent sur les achats de crypto de plus de 6,9 milliards de dollars enregistrés au T1

Selon les données publiées par la Banque centrale du Brésil, les achats de stablecoins représentaient 6,8 milliards de dollars sur les 6,9 milliards de dollars de cryptomonnaies achetés à l’étranger par des Brésiliens au cours du T1. Cela représente une hausse de plus de 100 % par rapport à la même période l’année dernière. Points clés : La Banque centrale du Brésil’s Central Ban

CoinpediaIl y a 21h

Les stablecoins émergent comme infrastructure financière centrale, les tendances de localisation s’accélèrent : rapport d’a16z

Message de Gate News, le 26 avril — Selon un rapport de chercheurs en crypto d’a16z, Robert Hackett et Jeremy Zhang, les stablecoins évoluent : d’instruments de trading et de véhicules d’épargne de première phase vers une infrastructure financière centrale. La loi U.S. GENIUS Act a

GateNews04-26 00:02
Commentaire
0/400
Aucun commentaire