Itsukaraの日記

【DRL, Montezuma】スライド再更新＋再々更新

Montezuma's Revengeのスライド更新時に、OpenAI Gymの方から結構詳しく聞かれた「pseudo-countの実装方法」を書き忘れたので、再更新しました。ソースを読めば分かると思っていましたが、それほどわかりやすいソースでもないので...　（この後、誤りに気付き、さらに更新しました）

DRL challenge on Montezuma's Revenge from 孝好飯塚