De acuerdo con la divulgación reciente de Cursor, la empresa presentó una técnica de entrenamiento llamada autoinstall para su serie de modelos Composer: usar un modelo de generación anterior para configurar automáticamente entornos ejecutables para el aprendizaje por refuerzo de la siguiente generación. Al entrenar Composer 2, Cursor usó Composer 1.5 para completar esta tarea. El método funciona en dos pasos: primero, un agente lee la documentación y la configuración del repositorio de código para generar 10 comandos de verificación con salidas esperadas; segundo, otro agente usa 3 de estos comandos para configurar el entorno desde cero hasta que los comandos se ejecuten correctamente, con un máximo de 5 intentos de reintento. Composer 2 logró una puntuación del 61,7% en Terminal-Bench, un benchmark que mide la capacidad de configuración del entorno, frente al 47,9% de Composer 1.5, lo que supone una mejora de 14 puntos porcentuales.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Public adquiere la aplicación Treasury de la plataforma de inversión en IA para ampliar el trading de cripto
Según ChainCatcher, Public anunció la adquisición de la plataforma de servicios de inversión en IA Treasury App para fortalecer su negocio de corretaje impulsado por IA. No se divulgó el monto de la adquisición. Public actualmente admite la negociación de acciones, bonos y criptomonedas, incluidos Bitcoin, Ethereum, a
GateNewshace1h
Blitzy completa una ronda de financiación $200M liderada por Northzone
Según ChainCatcher, Blitzy, una empresa de codificación con IA cofundada por el ex arquitecto de Nvidia Sid Pardeshi, ha completado una ronda de financiación de 200 millones de dólares liderada por Northzone. Battery Ventures, Jump Capital y Morgan Creek Digital participaron en la ronda. La plataforma puede analizar sistemas complejos con
GateNewshace1h
La UE prohíbe la pornografía deepfake generada por IA el 7 de mayo
Según la agencia Xinhua, el 7 de mayo, los miembros del Parlamento Europeo y los Estados miembros alcanzaron un consenso para prohibir que los sistemas de inteligencia artificial generen contenido pornográfico deepfake. La prohibición se incorporará en las enmiendas de la Ley de Inteligencia Artificial de 2024. Parlamento Europeo
GateNewshace2h
Tether lanza el modelo de IA médica MedPsy QVAC y logra una puntuación de 62,62 en la versión de 17 mil millones de parámetros
Según Odaily, Tether AI Research Group lanzó QVAC MedPsy, un modelo de IA médica diseñado para ejecutarse localmente en teléfonos inteligentes y dispositivos portátiles sin depender de la nube. La versión de 1,7 mil millones de parámetros obtuvo 62,62 en siete evaluaciones médicas, superando a MedGemma-1.5-4B de Google por 11,42 poi
GateNewshace2h
La API de B.AI lanza cuatro modelos nuevos, incluido GPT-5.5 Instant en las 48 horas posteriores al lanzamiento de OpenAI
La API de B.AI ha lanzado cuatro nuevos modelos: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 y GLM-5.1. GPT-5.5 Instant completó la adaptación subyacente y la integración de la interfaz en 48 horas desde el lanzamiento de OpenAI, lo que permite acceso sin retraso a
GateNewshace2h
El modelo de IA médica de Tether, de 1,7 mil millones, supera hoy a un competidor 16 veces más grande
Según el equipo de investigación de IA de Tether, la compañía lanzó hoy los modelos de lenguaje médicos de la serie QVAC MedPsy, diseñados para su implementación local en teléfonos inteligentes y dispositivos wearables sin dependencia de la nube. La versión de 1,7B parámetros obtuvo 62,62 en siete puntos de referencia médicos, superando a Google MedGemma-4B
GateNewshace2h