iRobotLab
開始行:
[[研究/各研究の話/2013年度]]
*強化学習における探査率の動的制御 [#jbadfd6f]
-強化学習における探査-利用のトレードオフに注目
-強化学習では行動選択法のパラメータによって探査-利用のバ...
--本研究では特にε-greedy法の探査率εについて扱う
-本研究ではロボットが自律的に環境に合わせて探査率εを調整...
-探査率εを環境遷移に関する情報量を用いて制御する方法を提案
#ref(ra.png)
終了行:
[[研究/各研究の話/2013年度]]
*強化学習における探査率の動的制御 [#jbadfd6f]
-強化学習における探査-利用のトレードオフに注目
-強化学習では行動選択法のパラメータによって探査-利用のバ...
--本研究では特にε-greedy法の探査率εについて扱う
-本研究ではロボットが自律的に環境に合わせて探査率εを調整...
-探査率εを環境遷移に関する情報量を用いて制御する方法を提案
#ref(ra.png)
ページ名:
既存のページ名で編集する