研究/ResearchActivity/2011-006 の変更点

追加された行はこの色です。
削除された行はこの色です。
研究/ResearchActivity/2011-006 へ行く。
研究/ResearchActivity/2011-006 の差分を削除

[[研究/各研究の話]]

*強化学習における情報量を用いた探索と利用の自律的制御 [#z7c8234e]
-強化学習における探索と利用のトレードオフに注目
-探索と利用のバランスはロボットのメタパラメータで調整するが，このパラメータは人間が一意に設定することが多い．
-本研究ではロボットが自律的に環境に合わせてパラメータを調整することを提案
-提案手法ではロボットの経験から情報量を算出し，算出した情報量を用いてパラメータを決定する
--現在，迷路問題にて有用性を検証中
#ref(Research Activity.png)
#ref(ra.png)

iRobotLab