読者です 読者をやめる 読者になる 読者になる

Itsukaraの日記

最新IT技術を勉強・実践中。最近はDeep Learningに注力。

Montezuma's RevengeのRoom8到達動画が出来ました

Montezuma's Revenge 機械学習 DRL Python

以前の記事で、DeepMindが未到達の部屋Room3, 8, 9に到達できたことを書きましたが、前回の時点ではRoom8到達動画がありませんでした。今回、Room8の到達動画が得られましたので、youtubeにアップしました。ちなみに、Room8は、下記でピンクに塗られている一番左の部屋です。

https://cdn-ak.f.st-hatena.com/images/fotolife/I/Itsukara/20161014/20161014230731.png

ROOM8到達動画

ROOM8には、ちょっと入っただけで直ぐ出てます。もう少し先まで行ってくれると良いのですが。
youtu.be

他の実験の状況

学習履歴長28〜31で5件の実験を行っていますが、スタート地点から左の部屋に行ったのは上記1つだけでした(学習履歴長は29)。後は、右側の部屋に行っています。スタート地点では鍵が1つしか得られないため、右か左か何れか一方のドアしか開けられず、学習の結果が何れか一方に偏ることが多いです。今回の実験では、左に行ったのは1/5ということでした。統計的には、もっと実験を重ねる必要があると思いますが、右に偏りやすいのかもしれません。

今後

当方はこれまで自由な時間が多く、Montezum's Revengeで色々なことをやって来ましたが、本日から、自由な時間は平日夜と土日のみになりました。そのため、今後は、記事が減少すると思います。