El equipo de Yann LeCun propuso un método de planificación jerárquica para mejorar la capacidad de razonamiento en largo plazo del modelo mundial JEPA.

robot
Generación de resúmenes en curso

NOTICIAS ME, 8 de abril (UTC+8), recientemente, el equipo de Yann LeCun propuso un método de planificación jerárquica basado en un modelo de mundo latente de múltiples escalas de tiempo, con el objetivo de abordar los dos grandes desafíos que enfrentan los modelos de mundo de aprendizaje en el control a largo plazo: la acumulación de errores de predicción y el crecimiento exponencial del espacio de búsqueda.
El método aprende modelos de mundo latentes en diferentes escalas de tiempo y realiza planificación jerárquica entre escalas, logrando razonamiento a largo plazo y reduciendo significativamente la complejidad de planificación durante la inferencia.
Este marco puede funcionar como un módulo de abstracción tipo plugin, aplicable a varias arquitecturas de modelos de mundo latentes y dominios.
Los experimentos muestran que, en tareas de robots en el mundo real no codiciosas (como agarrar y soltar), solo con el objetivo final, la planificación jerárquica logra una tasa de éxito del 70%, mientras que el modelo de mundo de una sola capa tiene una tasa de éxito del 0%.
En entornos de simulación basados en física (como operaciones de empuje y navegación en laberintos), la planificación jerárquica obtiene tasas de éxito más altas y reduce hasta 3 veces el tiempo de cálculo necesario para la planificación.
El método no depende de recompensas específicas de la tarea ni de subobjetivos proporcionados externamente, demostrando una fuerte capacidad de generalización en entornos y tareas no vistos.
(Fuente: InFoQ)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado