研究/各研究の話/2013年度
センサを介したインタラクションによる報酬の自己生成†
- 強化学習等に用いる報酬を,センサへの入力を用いてロボット自身に生成させる.
- 学習において報酬がどのように利用されるかを知らない人間でもロボットに学習させられるような手法を目指す.
- センサ入力から報酬を生成するために,センサ入力の良し悪しを評価する.
- ロボットはセンサ入力の良し悪しから自身が得る報酬を生成する.
Example:Reinforcement Learning
Last-modified: 2023-03-29 (水) 10:47:55