Itsukaraの日記

最新IT技術を勉強・実践中。最近はDeep Learningに注力。

A3Cでのbreakout学習済networkをgithubにアップしました

下記でDeep Learningの最新技術A3Cでゲームbreakoutを試したことを書きましたが、よく考えたら学習済networkをgithubにアップロードするのを忘れていました。先ほどgithubにアップロードしました。試したい方はどうぞ。

itsukara.hateblo.jp

tensorflowが動く環境ならば、下記により、学習済networkでのゲームプレイが見れます。
ご参考まで。

(tensorflow) $ git clone https://github.com/Itsukara/async_deep_reinforce.git
(tensorflow) $ cd async_deep_reinforce/
(tensorflow) $ python a3c_display.py

ちなみに、87.7M steps学習した結果です。90M 〜 100M stepsでは、平均SCOREが落ちていくので、直前となる87.7M stepsのデータをアップしました。平均SCOREの曲線は、一度掲載済ですが、参考までに下記に再掲載します。

f:id:Itsukara:20160802181608p:plain