【DL、RL】A3C+のpseudo-count無しの途中再開は今ひとつ
直前の記事で、pseudo-countの保存機能の無い版のソースコードを公開したと書きましたが、やはり、pseudo-count無しの途中再開は、中断前の平均得点に戻るまで時間が掛かりそうです。下記が、pseudo-count無しでの再開の状況です。
誰か、pseudo-countのセーブ、ロード機能作成で協力者がいると嬉しいのですが...
ソースコードは下記です。
github.com
直前の記事で、pseudo-countの保存機能の無い版のソースコードを公開したと書きましたが、やはり、pseudo-count無しの途中再開は、中断前の平均得点に戻るまで時間が掛かりそうです。下記が、pseudo-count無しでの再開の状況です。
誰か、pseudo-countのセーブ、ロード機能作成で協力者がいると嬉しいのですが...
ソースコードは下記です。
github.com