【DRL,Montezuma】ROOM#7訪問とROOM#1 killの関係

2つ前の記事で、ROOM#7の訪問が増えることで、ROOM#1の学習状態に影響を与えるようだと書きましたが、現在行っている学習でも、同じようなことが起こっているようなので、ご報告します。正確な理由は不明ですが、なぜか、これらの間には相関が大きいように見…

2017-01-08

【DRL,Montezuma】学習状況確認のためのツール

Deep Learning DRL DRL, Montezuma Montezuma's Revenge Python ITのお勉強

Montezuma's Revengeの強化学習において、平均スコアだけでは、学習状況が良くわからないので、各種状況を表示するツールを追加しました(plot2.pyとall-plot)。これらを用い、下記のような感じで学習状況をモニタしながら実験を進めています。ご参考まで。 …

2017-01-08

【DRL,Montezuma】Scoreが0になり回復しない原因の分析

Deep Learning DRL DRL, Montezuma Montezuma's Revenge Python ITのお勉強

Montezua's Revengeの強化学習で、下記のように、Scoreが0になり回復しない場合がありましたが、原因を少し分析してみました。 Scoreが0になり回復しない状況調査 Scoreが0になった後は、ROOM#1でPanama Joeが死にまくるのかと思っていましたが、これは誤っ…

2017-01-08

【DRL,Montezuma】ALE環境でLaser Barrier通過！

Deep Learning DRL DRL, Montezuma Montezuma's Revenge Python ITのお勉強

あけましておめでとうございます。相変わらず、Montezuma's Revengeの強化学習実験を行っています。 GCPから自宅PCへ昨年は、GCP (Google Cloud Platform)の無料枠($300、3ヶ月以内)を使い、格安のPreemptible VMを活用し、一度に8個の学習を行っていたの…

Itsukaraの日記

最新IT技術を勉強・実践中。最近はDeep Learningに注力。

2017-01-08から1日間の記事一覧

【DRL,Montezuma】ROOM#7訪問とROOM#1 killの関係

【DRL,Montezuma】学習状況確認のためのツール

【DRL,Montezuma】Scoreが0になり回復しない原因の分析

【DRL,Montezuma】ALE環境でLaser Barrier通過！