トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS   ログイン

研究/ResearchActivity/2011-006 の変更点

[[研究/各研究の話]]

*強化学習における情報量を用いた探索と利用の自律的制御 [#z7c8234e]
-強化学習における探索と利用のトレードオフに注目
-探索と利用のバランスはロボットのメタパラメータで調整するが,このパラメータは人間が一意に設定することが多い.
-本研究ではロボットが自律的に環境に合わせてパラメータを調整することを提案
-提案手法ではロボットの経験から情報量を算出し,算出した情報量を用いてパラメータを決定する
--現在,迷路問題にて有用性を検証中
#ref(Research Activity.png)
#ref(ra.png)