- 汎用的な価値観の設計
- 二階堂芳:外界とのインタラクションによる強化学習の報酬の自己生成
- 石塚 昌也:複数センサを用いた報酬の自己生成-危険回避を重視したセンサの重要度の決定-
- 栗木康汰:マルチモーダルインタラクションを用いた報酬の自己生成-重み付けによるセンサ評価の統合と教示への適用-
- 伊藤翠那:音入力に対する強さと予測性を用いた報酬の自己生成
- 福澤航大:複数センサにおけるエージェントと人の相互学習の実現 -学習への寄与度に基づく効果的な入力センサの提示-
- タスク発見
- 白倉聖也:環境変化に起因する報酬構造の変化への適応〜ロボットの学習空間の生成・選択による再学習の回避〜
- 下口侑也:Decision Making on Robot using Motivation-Desire Model -Improvement of Learning efficiency by Autonomous-
- 小橋遼:報酬の差異による単体サブゴール発見手法の提案
- マルチタスク下での意思決定
- 下口侑也:人-ロボット間の相互作用による達成依頼度の決定-相対評価を用いた個人差への適応
- 大沢航洋:複数タスク下における優先度を用いたロボットの行動選択-中間行動による行動の細分化と連続化-
- 白倉聖也:Adaptation to multi tasks by reflecting person hope degree for importance
- 田中研也:複数タスク下におけるロボットの行動学習-深層強化学習による連続状態への適応-
- 前田颯人:複数タスク下におけるロボットの行動選択-優先度に関するパラメータの動的更新による行動停止の回避-
- 単体ロボット内でのマルチエージェントシステム
- 高田陽:反復合議型MARLを用いた単体ロボットの行動学習 -非同期的な意思決定による対故障性の実現-
- 櫻庭康平:複数エージェントの融合・分離による単体ロボットの行動学習 -エージェントの組み合わせ最適化による学習効率の向上-
- 井上昂浩:ヘテロエージェント群による単体ロボットにおける行動学習-好奇心・学習・制御エージェント間の協調による耐故障性の向上-
- 松嶋龍文:単体ロボットにおけるHMARLを用いた行動学習-TD誤差に応じた興味度の更新による学習性能の向上-
- 応用事例
- 今田大聖:カウンセリングロボットによる頷きの傾聴効果の検証-発話量を基とした定量的評価の提案-
- 高橋茉莉奈:カウンセリングロボットにおける言語の評価極性を考慮した定量的評価の提案
- 阿部廉人:カウンセリングロボットにおける頷き回数のランダム化による傾聴効果の改善