no tengo intuición de por qué o cómo "básicamente solo PPO pero como mucho y con recurrencia" puede aprender estas estrategias de orden superior. ¡es realmente increíble que lo hagan!
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
9 me gusta
Recompensa
9
8
Republicar
Compartir
Comentar
0/400
ApeWithAPlan
· 09-22 07:48
fr desearía tener alguna pista de cómo funciona esta cosa, para ser honesto.
Ver originalesResponder0
AirdropHermit
· 09-21 05:40
ppo es increíble
Ver originalesResponder0
Degen4Breakfast
· 09-19 22:59
Reglas metafísicas, ¿verdad?
Ver originalesResponder0
DefiEngineerJack
· 09-19 22:51
*sigh* la intuición ingenua está sobrevalorada. la verificación empírica es alfa.
Ver originalesResponder0
consensus_whisperer
· 09-19 22:50
¡Dios mío, PPO increíble!
Ver originalesResponder0
HashRatePhilosopher
· 09-19 22:48
Verdaderamente es Potencia computacional, punto por punto.
no tengo intuición de por qué o cómo "básicamente solo PPO pero como mucho y con recurrencia" puede aprender estas estrategias de orden superior. ¡es realmente increíble que lo hagan!