用GAIL及Pytorch解出MountainCar有賞金
用GAIL(Generative Adversarial Imitation Learning)及Pytorch解出MountainCar-v0
, 賞金五千元。
使用原始的TRPO或PPO來訓練policy均可,也可將原始的GAN換成Wasserstein GAN 。 底
下連結可供參考,至少專家軌跡是可用的。
一旦成功完成,請寄給我結果和部份程式的截圖,我就會將錢匯入指定帳戶,然後再把原
始碼寄給我即可
https://github.com/alanyuwenche/GAIL_MountainCar_CartPole
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.161.187 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Trading/M.1608702911.A.EE7.html
→
12/25 09:01,
4年前
, 1F
12/25 09:01, 1F
Trading 近期熱門文章
PTT職涯區 即時熱門文章