研究/各研究の話

確率表現を用いた報酬非依存型知識の提案

  • 動的な環境に適応するため,報酬非依存型知識の確率化を提案し,「確率的報酬非依存型知識」を定義した
  • ロボットの状態遷移を基にある状態に遷移する確率確率を算出し,知識として記憶する
  • 迷路内に障害物が存在する迷路問題において実験を行った
  • 結果,従来の報酬非依存型知識よりも確率的報酬非依存型知識が動的環境に適応していることを実証した
Reseach Activity.png

添付ファイル: fileReseach Activity.png 318件 [詳細]