🥷 #OpenAI and Paradigm launched EVMbench, a benchmark designed to measure how well #Los agentes de IA pueden detectar, parchear y explotar vulnerabilidades en ecosistemas EVM como Ethereum. El benchmark se construye a partir de 120 vulnerabilidades de alta gravedad seleccionadas de 40 auditorías e incluye escenarios relacionados con la cadena Tempo. Las pruebas muestran que GPT-5.3-Codex obtuvo un 72.2% en modo "explotar" en comparación con GPT-5 que alcanzó un 31.9%, mientras que la cobertura para detección y parcheo de vulnerabilidades sigue siendo incompleta. #hack
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
🥷 #OpenAI and Paradigm launched EVMbench, a benchmark designed to measure how well #Los agentes de IA pueden detectar, parchear y explotar vulnerabilidades en ecosistemas EVM como Ethereum. El benchmark se construye a partir de 120 vulnerabilidades de alta gravedad seleccionadas de 40 auditorías e incluye escenarios relacionados con la cadena Tempo. Las pruebas muestran que GPT-5.3-Codex obtuvo un 72.2% en modo "explotar" en comparación con GPT-5 que alcanzó un 31.9%, mientras que la cobertura para detección y parcheo de vulnerabilidades sigue siendo incompleta. #hack
#crypto