読者です 読者をやめる 読者になる 読者になる

Itsukaraの日記

最新IT技術を勉強・実践中。最近はDeep Learningに注力。

【DRL, Montezuma】到達部屋追加でスライド更新(20161205)

Montezuma's Revenge DRL 機械学習 Python

懲りずに続けているMontezuma's Revengeの実験ですが、到達部屋が1つ増えましたので(下図最下段の右端)、スライドを更新しました。下記がこれまでの到達部屋です。

f:id:Itsukara:20161205234507p:plain

なお、Thread毎の環境の多様性を高めた実験の途中結果を下記に置きました。今のところ、SCOREが0点で貼り付く現象は置きておらず、そこそこ順調です。gcp70のグラフを見ると、SCOREが何回も0点になっていますが、しぶとく、400点に回復しています。ただ、残念ながら、点数はあまり上がっていません。

ちなみに、DeepMindの論文記載の到達部屋は下記であり、到達部屋に関してはDeepMindを超えています。
f:id:Itsukara:20161225040856p:plain