読者です 読者をやめる 読者になる 読者になる

Itsukaraの日記

最新IT技術を勉強・実践中。最近はDeep Learningに注力。

【DL、A3C+、OHL、Montezuma】GCPのマシンタイプ変更

直前の記事で、A3C+OHLでのMontezuma's Revengeの評価にGoogle Cloud Platform (GCP)を使っている話を書きましたが、先ほど確認したら、なぜかnohupしたプロセスがkillされていました。

/var/log/syslogを確認したところ、下記のように、メモリ不足になった模様。

Sep  8 14:57:43 gcp-ubuntu-40 kernel: [83223.386573] Out of memory: Kill process 4097 (python) score 966 or sacrifice child
Sep  8 14:57:43 gcp-ubuntu-40 kernel: [83223.394341] Killed process 4092 (python) total-vm:9856940kB, anon-rss:7087004kB, file-rss:0kB
Sep  8 15:17:01 gcp-ubuntu-40 CRON[1963]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)

使っているマシンタイプはn1-highcpu-8(8VPUx7.2GBRAM)でしたが、これでは足りないようです。メモリリークなど、原因があるとは思いますが、とりあえず、一度止めて、マシンタイプをn1-standard-4(4CPUx15GBRAM)に変更しました。

ちなみに、インスタンスタイプ変更ですが、マシンのインスタンス名をクリックして詳細を表示し、画面左上方に表示される「編集」をクリックすれば、簡単に変更できます。
f:id:Itsukara:20160909014549j:plain

なお、GCPは、CPU数やメモリ量を自由にカスタマイズできるので、単にメモリ量だけ減らしても良かったのですが、2日ほどマシンにアクセスできなくなる予定なので、4VPUでじっくりと計算することにしました。