- 汎用的な価値観の設計
- 二階堂芳:外界とのインタラクションによる強化学習の報酬の自己生成
- 石塚 昌也:複数センサを用いた報酬の自己生成-危険回避を重視したセンサの重要度の決定-
- 福澤航大:複数センサを用いた報酬の自己生成 -少数センサの単体評価とセンサ間の関連付けによる報酬生成-
- Afiqe Anuar:汎用的な評価指標を用いた報酬の自己生成 -センサ入力に対する多面的評価の提案と危険検知の向上-
- 近藤奏介:Hebb則を用いた複数センサの関連付けによる報酬の自己生成
- タスク発見
- 下口侑也:欲求-動機モデルを用いたロボットの意思決定~評価とセンサの相関関係に基づくタスクの自律獲得
- 白倉聖也:環境変化に起因する報酬構造の変化への適応〜ロボットの学習空間の生成・選択による再学習の回避〜
- マルチタスク下での意思決定
- 大沢航洋:優先度を用いた複数タスク下の意思決定-行動の細分化による効率的なタスク達成の実現-
- 下口侑也:欲求-動機モデルを用いたロボットの意思決定~評価とセンサの相関関係に基づくタスクの自律獲得
- 白倉聖也:Adaptation to multi tasks by reflecting person hope degree for importance
- 上林拓馬:優先度を用いた複数タスク下における意思決定-優先度の部分設計による環境への適応性の向上-
- 飛世賢宏:複数タスク下におけるロボットの意思決定-探索タスク導入による学習効率の向上-
- 単体ロボット内でのマルチエージェントシステム
- 井上昂浩:MARLによる単体ロボットにおける行動学習 -幾何的拘束に起因した疑似学習空間の形成による学習性能の向上-
- 松嶋龍文:単体ロボットにおける分散型深層強化学習を用いた行動学習-学習進度に基づく確率的なエージェント選択による効率的探索-
- 後藤成海:単体ロボットにおけるHMARLを用いた行動学習-行動数の増加に応じたエージェントの除外による学習効率の向上-
- 応用事例
- 岡崎優:カウンセリングロボットにおける傾聴効果の改善-強化学習を用いた頷き回数の学習-
- 佐藤響介:深層強化学習を用いたPID制御の性能向上 -目標値に応じたゲインの動的決定-
Last-modified: 2023-03-29 (水) 10:47:55