【DRL,Montezuma】まずは現状版コードを試行中

今後、Montezuma's Revengeの強化学習に、色々と機能を追加してみようと思いますが、ここ何ヶ月も現状版コードを動かしたことがないので、まずは、現状版コードを動かし、ある程度学習が進んだ状態でのcheckpointを取ってます。PCの画面としては、下記のよう…

2017-04-22

シンギュラリティサロン参加：多目的遺伝的アルゴリズム

シンギュラリティ ITのお勉強

「シンギュラリティサロン@東京『第18回公開講演会』に参加しました。「実用化が進む進化計算とその応用」というタイトルで、東北大学流体科学研究所・所長／教授の大林茂さんが発表されました。流体力学や航空機(MRJ)、多目的遺伝的アルゴリズムなどに関し…

2017-04-22

【DRL,Montezuma】当方の結果が論文で参照されました嬉!

DRL, Montezuma Deep Learning Montezuma's Revenge DRL 機械学習人工知能

論文(https://arxiv.org/abs/1704.05539)で、OpenAI GymのMontezum's Revengeでの当方の結果が引用されました。とても嬉しいです! 下記(p.9)のItsukaraです。上記は、OpenAI GymのMontezum's Revenge(下記)からの抜粋です。 gym.openai.com当方は、2016/10/1…

2017-04-20

【DRL,Montezuma】スライド(日本語版)を更に更新

DRL, Montezuma Deep Learning Montezuma's Revenge DRL 機械学習人工知能

強化学習による「Montezuma's Revenge」への挑戦についてのスライド(日本語版)、SIG-WBAオフ会で本日発表したのを機に更新したのですが、状態のループ(時間を考慮しない影響)の説明が不十分だったので追記しました。強化学習による「Montezuma's Revenge」…

2017-04-20

【DRL,Montezuma】スライド(日本語版)を更新しました

Montezuma's Revenge Deep Learning 機械学習人工知能

強化学習による「Montezuma's Revenge」への挑戦についてのスライド(日本語版)がかなり古かったので、SIG-WBAオフ会で本日発表したのを機に更新しました。強化学習による「Montezuma's Revenge」への挑戦 from 孝好飯塚 www.slideshare.net

2017-04-16

【DRL,Montezuma】既に一位ではなくなっていた、残念

OpenAI GymのMontezuma's Revengeで一位を取り、昨年の12月にサンフランシスコのOpenAIに説明に行く機会がありましたが、久しぶりにOpenAI Gymのサイトを見たところ、今年3月8に、pkumusicさんが1位を取り、当方は既に1位ではなくなっていました。・当方のス…

2017-04-16

DNC (Differentiable Neural Computers)の発表を聴講

人工知能機械学習 Deep Learning

昨日参加した人工知能関連イベント(下記)、DNC (Differentiable Neural Computers)に関し発表と活発な議論があり、とても勉強になりました。また、久しぶりに人工知能関連の会話ができ、非常に楽しめました。 https://do2dle.connpass.com/event/53552/今回…