saya tidak punya intuisi mengapa atau bagaimana "pada dasarnya hanya PPO tetapi seperti banyak dan dengan pengulangan" dapat mempelajari strategi urutan yang lebih tinggi. saya berharap suatu hari nanti! tetapi sangat luar biasa bahwa mereka melakukannya.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
8 Suka
Hadiah
8
8
Posting ulang
Bagikan
Komentar
0/400
ApeWithAPlan
· 4jam yang lalu
fr saya berharap saya memiliki sedikit petunjuk tentang bagaimana semua ini bekerja sejujurnya
Lihat AsliBalas0
AirdropHermit
· 09-21 05:40
ppo terlalu hebat
Lihat AsliBalas0
Degen4Breakfast
· 09-19 22:59
Aturan metafisika ya
Lihat AsliBalas0
DefiEngineerJack
· 09-19 22:51
*sigh* intuisi naif terlalu dibesar-besarkan. verifikasi empiris adalah alpha.
saya tidak punya intuisi mengapa atau bagaimana "pada dasarnya hanya PPO tetapi seperti banyak dan dengan pengulangan" dapat mempelajari strategi urutan yang lebih tinggi. saya berharap suatu hari nanti! tetapi sangat luar biasa bahwa mereka melakukannya.