研究/ResearchActivity/2013年度/02

2018-04-16 (月) 15:53:00 (64d)

研究/各研究の話/2013年度

強化学習における探査率の動的制御

  • 強化学習における探査-利用のトレードオフに注目
  • 強化学習では行動選択法のパラメータによって探査-利用のバランスを制御
    • 本研究では特にε-greedy法の探査率εについて扱う
  • 本研究ではロボットが自律的に環境に合わせて探査率εを調整することを目的とする
  • 探査率εを環境遷移に関する情報量を用いて制御する方法を提案
ra.png