研究/各研究の話

強化学習における状態空間の自動決定

  • 強化学習に適した状態をロボットが自動的に獲得することで,環境に応じて状態を設定できるシステムを構築.
  • 状態を設定するために状態の分割と融合を繰り返して,適切な設定を見つける.
  • ロボットは知識を用いて,適切な状態の設定を見つけつつ,学習目標を達成する.


ikeyoshi.png

添付ファイル: fileikeyoshi.png 452件 [詳細]