「Pythonで体験する深層学習」第5章輪講資料アップロード

本日、Do2dle（ドゥードゥル）研究会の輪講があり、当方が担当した「Pythonで体験する深層学習」第5章の輪講資料を説明しました。輪講資料を作るのにかなり間が掛かり、もったいないので、slideshareにアップロードしました。 Pythonで体験する深層学習 5…

2016-11-13

【DRL, Montezuma】スライドを更新

Montezuma's Revenge DRL 機械学習 Python ITのお勉強

到達した部屋が以前よりもかなり増えているので、スライドを更新しました(p.18)。また、到達した部屋に至る動画もスライドの途中に追加しました。日本語版 DeepMind論文(2016/6) 「Unifying Count-Based Exploration and Intrinsic Motivation 」記載のPse…

2016-11-12

【DRL, Montezuma】Room18, 19に到達しました

DRL, Montezuma Montezuma's Revenge 機械学習 DRL Python ITのお勉強

最近は、定職についたため、なかなかDeepLearningのソースコードをいじる機会がなく、同じソースコードのままで、色々とパラメーターを変えて試しています。その結果、新たに、Room18、19に到達しましたので、動画を下記にアップしました。 youtu.beDeepMind…

2016-11-03

英語スライドなのに、日本からのアクセスが多い Why？

Montezuma's Revenge 機械学習 Python ITのお勉強

Montezuma's Revengeの件を英語スライドにしたら、結局、10日強で200件のアクセスがありましたが、アクセス元は日本・米国・中国が15:6:3の比率で、なぜか日本からのアクセスが多かったです。Why?上記、合計が200にならないのも気になりますが...

2016-10-22

OpenAI Gymとのテレコンの反省から英語版スライドを作成

Montezuma's Revenge 機械学習 Python ITのお勉強

以前の記事で、OpenAI Gymから$250のご支援を頂くことになったことを書きましたが、その関係で、本日OpenAI Gymの方と電話会議をする機会がありました。OpenAI Gymにアップロードしたプログラムのことを説明したのですが、英語版のスライドを用意していなか…

2016-10-22

OpenAI GymにMontezuma' Revengeの最高得点更新

Montezuma's Revenge 機械学習 Python ITのお勉強

以前の記事で、Montezuma's Revengeの最高得点をOpenAI Gymサイトにアップしたことを書きましたが、さらに高い点数が出ましたので、更新しました。前回1127点に対して、今回は1284点と約150点アップしました。gym.openai.com

2016-10-21

DRLの学習状況をスマホからいつでも見れるようにしました

ITのお勉強 Montezuma's Revenge 機械学習

昨日から、自宅にいることが少なくなったため、外出先でスマホからDRLの学習状況をすぐに見れるようにしました。具体的には、AWSの無料枠で動かしているEC2 VMにapache2を導入し、gcpの各VMでの学習曲線(.png)と到達ルーム(.rooms)をapache2のドキュメントル…

2016-10-19

小技：GCPインスタンスのIPアドレス一覧

インフラ ITのお勉強

GCP (Google Cloud Platform)のPreemptible VM Instancesを活用し、無料枠内で4CPUのVM Instance 6台を2か月運用する予定ですが、Preemptible VM Instancesは24時間で自動的に停止するので、停止したVMを検出して自動再起動するようにしています。詳細は、以…

2016-10-19

VM再起動対応で入れたthread間同期は影響がありそう

Montezuma's Revenge 機械学習 Python ITのお勉強

前回記事で、自宅PCとGCPで学習曲線が極端に異なる事を書きました。その原因として、VM再起動対応で入れたthread間の同期の影響も考えられるので、確認しました。結果、影響がありそうです。自宅PCは仮想コア8でthread数8に対し、GCPは仮想コア4でthread数4…

2016-10-18

自宅PCとGCPで学習曲線が極端に異なる

原因不明 Montezuma's Revenge 機械学習 Python ITのお勉強

独自DRL環境(A3C + Pseudo-Code + On-Highscore-Learning)の評価はGCP(Google Cloud Platform)で進めているのですが、同じ条件で評価しても、自宅PCと学習曲線が極端に異なる場合があることが分かりました。念の為、両方共2回評価したのですが、自宅PCでは0.…

2016-10-18

OpenAI Gymから$250のご支援を頂くことになりました

Montezuma's Revenge 機械学習 Python ITのお勉強

OpenAI GymにMontezuma's Revengeの評価結果を出した件、ついでに評価用AWSクレジット$250クレジットに応募したところ、OKが出ました。OpenAI Gymにアップロードした甲斐がありました。これで、GPUを使った高速な評価ができそうです。

2016-10-17

DRL学習プログラムのVM再起動対応強化の準備中

Montezuma's Revenge 機械学習 Python ITのお勉強

前回記事で、VM再起動のDRL学習プログラムへの影響を書きましたが、この解決に向けて、全ThreadのPseudo-count情報をsave/loadする機能を作成中です。そのためには、Thread間での同期処理が必要であり、これを誤ると後で発見するのが大変なので、まずはテス…

2016-10-16

VM再起動の学習への影響

DRL, Montezuma Montezuma's Revenge 機械学習 Python ITのお勉強

前回記事に記載のように、GCPの格安な「Preemptible VM Instance」を使って、独自機能付DRL(A3C+Pseudo-count+On-Highscore-Learning(OHL)の実験中です。具体的には、Montezuma's Revengeへの適用実験をしていますが、Preemptible VM InstanceによるVM再起動…

2016-10-15

DRLでの格安なGCP Preemptible VM Instanceの利用方法

インフラ ITのお勉強 Montezuma's Revenge 機械学習

DRL(Deep Reinforcement Learning)の環境としてGoogle Cloud Platform(GCP)の無料枠($300まで and 2ヶ月まで無料)を使っていますが、当方のDRL環境に合ったマシン(4CPU+8GBメモリ)を通常通り使用すると$90/月掛かるため、$300では3台月強が上限となります。…

2016-10-15

OpenAI GymでのMontezuma's Revenge評価の影響要因

Montezuma's Revenge 機械学習 Python ITのお勉強

OpenAI Gymで得点に特に影響した要素について記載します。の値 Pseudo-count(擬似的な出現回数)から計算されるReward計算式(下記)でのは特に影響が大きかったです。 Azure*1やGoogle Cloud Platform*2の無料枠で得られる計算資源しか使えないため、余り包括…

2016-10-14

Montezuma' Revengeの到達部屋でDeepMindを超えました！

Montezuma's Revenge 機械学習 Python ITのお勉強

Deep Reinforcement LearningでAtariのゲームMontezuma's Revengeを攻略した結果をOpenAI Gymにアップしたことを前回記事で書きましたが、その時の平均スコア(448点)に対し、同じ設定で更に高い平均点(1127点)が得られましたので、再度、OpenAI Gymにアップ…

2016-10-14

OpenAI GymにMontezuma' Revengeの最高得点アップ

Montezuma's Revenge 機械学習 Python ITのお勉強

ここ２ヶ月ほど取り組んできたMontezuma's Revengeの件、OpenAI Gymでも動くようにし、下記サイトにアップいたしました。一応、歴代最高得点となります。是非、レビューいただけるとありがたいです。 gym.openai.com

2016-10-07

初等線形代数・統計でMNISTの94.8%の画像を正しく分離

機械学習 Python ITのお勉強

昨日の記事で、初等的な線形代数と統計のみで、MNISTの94.0%の画像を正しく分離できたことを書きましたが、手法を少しだけ見なおすことで、精度が94.8%になりました。 0: ok=4853(98.0%), ng=97(2.0%) 1: ok=5191(92.3%), ng=432(7.7%) 2: ok=4827(97.2%), n…

2016-10-05

初等線形代数・統計でMNISTの94%の画像を正しく分離！

機械学習 Python Auto Encoder ITのお勉強

前回記事でVAE(Variational Autoencorder)の中間層のデータ構造について書きましたが、MNISTの画像データ群自体の構造を、同様の手法で分析しました。結果、MNISTの50,000個の画像のうち94.0%は正しく分離できました*1。また、50,000個の画像の分類に基づい…

2016-09-20

SlideShareに中国サイバー軍アクセス？心当たり反応求む！

セキュリティ ITのお勉強

前回の記事で、SlideShareに初めてファイルをアップロードしたところ、中国からのアクセスが意外に多かった書きましたが、その後、アクセス元の関連情報をWEBで調べたところ、中国サイバー軍の定期的情報収集の一環ではないかと思っております。つまり、Slid…

2016-09-19

SlideShareは無料でアクセス詳細分析ができて凄い！

ITのお勉強 Montezuma's Revenge 機械学習 DRL

9/15の記事で、これまで本ブログに書いてきた内容をSlideShareに載せたことを書きましたが、今回初めてSlideShareにアップロードして、SlideShareの詳細分析機能の素晴らしさに驚いています。下記は、アクセス数のグラフです。ある程度関心を持って頂き、98…

2016-09-09

【DL、A3C+、OHL、Montezuma】GCPのマシンタイプ変更

Montezuma's Revenge 機械学習 Python ITのお勉強

直前の記事で、A3C+OHLでのMontezuma's Revengeの評価にGoogle Cloud Platform (GCP)を使っている話を書きましたが、先ほど確認したら、なぜかnohupしたプロセスがkillされていました。/var/log/syslogを確認したところ、下記のように、メモリ不足になった模…

2016-09-06

【DL、A3C+、OHL、Montezuma】パラメーターの影響確認中

機械学習 Python ITのお勉強 Montezuma's Revenge

A3C+に独自機能(On-Highscore-Learning)を加えたプログラムでのMontezuma's Revengeの強化学習を試行中です。学習に時間が掛かるため、最適なパラメータを探索できず、山勘で選んでいると書きましたが、実は、学習が終了するのを待ちきれず、学習途中でも、…

2016-09-06

Variational Autoencoderの中間層データの性質

機械学習 Python ITのお勉強 Auto Encoder

9/1の記事と9/3の記事で、Variational Autoencoderの中間層の話を書きましたが、その後、山田さんから「中間層が5次元での画像の再現状況は？」との質問を頂きました。これを改めて確認しました(後述)。ちなみに、当方は、VAEに詳しいわけではなく、単にVAE…

2016-09-03

Variational Autoencoderの20次元中間層内距離の件(続き)

機械学習 Python ITのお勉強 Auto Encoder

9/1の記事で、Variational Autoencoderの20次元中間層の構造に関して記載し、なぜか20次元のうち20次元のみが活性化されている件を書いたところ、本件を紹介頂いたNTT研究所山田さんから、次元を変えても10次元のみが活性化されるか確認してみると良いのでは…

2016-09-03

【DL、RL、A3C+】Montezumaで最高得点2600点取得の不思議さ

機械学習 Python ITのお勉強 Montezuma's Revenge

直前の記事で、Montezumaで最高得点2600点が出たことを書きましたが、これはとても不思議なことです。つまり、49M STEPSのTraining中に2600点が出なかったのに、プレイ動画生成での10回程度のプレイ時に26000点が出たのは、確率的に見て非常に不思議というこ…

2016-09-03

【DL、RL、A3C+】Montezumaで最高得点2600点取得！！！

機械学習 Python ITのお勉強 Montezuma's Revenge

A3C+独自機能("on-highscore-learning"と命名、OHLと略記)でMontezuma's Revengeを評価しており、平均点500点強で伸びなくなり49M STEPSで中断しましたが、Trainingデータでのプレイ動画を撮り忘れたので念の為撮ったところ、何と、初の最高得点2600点を取得…