研究/ResearchActivity/2013年度/02 - iRobotLab

認知ロボティクス研究室>研究>ResearchActivity>2013年度>02

研究/各研究の話/2013年度

強化学習における探査率の動的制御†

強化学習における探査-利用のトレードオフに注目
強化学習では行動選択法のパラメータによって探査-利用のバランスを制御
- 本研究では特にε-greedy法の探査率εについて扱う
本研究ではロボットが自律的に環境に合わせて探査率εを調整することを目的とする
探査率εを環境遷移に関する情報量を用いて制御する方法を提案

添付ファイル:

ra.png 760件 [詳細]

Last-modified: 2023-03-29 (水) 10:47:55