研究/各研究の話

  • 報酬に依存しない情報を知識化することを提案し,報酬非依存型知識と定義した
  • 強化学習において報酬非依存型知識を利用するシステムを構築した
  • 報酬非依存型知識を強化学習に組み込むことで,学習の効率を上げ,タスク変化に柔軟に対応できるようにした
  • 構築したシステムを迷路問題へ適用し,報酬非依存型知識を利用することが有用であることを示した


ResearchActivity01.png


ResearchActivity02.png

添付ファイル: fileResearchActivity01.png 336件 [詳細] fileResearchActivity02.png 345件 [詳細]