- 福澤航大センサ評価の統合による報酬の自己生成 -評価センサの動的選択による危険検知の向上-
- 松嶋龍文:単体ロボットにおける分散型深層強化学習を用いた行動学習-学習進度に基づく確率的なエージェント選択による効率的探索-
- Afiqe Anuar:汎用的な評価指標を用いた報酬の自己生成 -センサ入力に対する多面的評価の提案と危険検知の向上-
- 岡崎優:カウンセリングロボットにおける傾聴効果の改善-強化学習を用いた頷き回数の学習-
- &ref(): File not found: "research_activity_okazaki.pdf" at page "研究/各研究の話/2020年度";
- 上林拓馬:優先度を用いた複数タスク下における意思決定-優先度の部分設計による環境への適応性の向上-
- 後藤成海:単体ロボットにおけるHMARLを用いた行動学習-行動数の増加に応じたエージェントの除外による学習効率の向上-
- &ref(): File not found: "research_activity_gotoh.pdf" at page "研究/各研究の話/2020年度";
- 近藤奏介:Hebb則を用いた複数センサの関連付けによる報酬の自己生成
- 佐藤響介:深層強化学習を用いたPID制御の性能向上 -目標値に応じたゲインの動的決定-
- &ref(): File not found: "research_activity_satoh.pdf" at page "研究/各研究の話/2020年度";
- 飛世賢宏:複数タスク下におけるロボットの意思決定-探索タスク導入による学習効率の向上-
- &ref(): File not found: "research_activity_tobise.pdf" at page "研究/各研究の話/2020年度";