研究/ResearchActivity/2011-006 - iRobotLab

認知ロボティクス研究室>研究>ResearchActivity>2011-006

研究/各研究の話

強化学習における情報量を用いた探索と利用の自律的制御†

強化学習における探索と利用のトレードオフに注目
探索と利用のバランスはロボットのメタパラメータで調整するが，このパラメータは人間が一意に設定することが多い．
本研究ではロボットが自律的に環境に合わせてパラメータを調整することを提案
提案手法ではロボットの経験から情報量を算出し，算出した情報量を用いてパラメータを決定する
- 現在，迷路問題にて有用性を検証中

添付ファイル:

ra.png 880件 [詳細]

Last-modified: 2023-03-29 (水) 10:47:55