- 福澤航大:センサ評価の統合による報酬の自己生成 -評価センサの動的選択による危険検知の向上-
- 松嶋龍文:単体ロボットにおける分散型深層強化学習による探索行動の効率化
- Afiqe Anuar:汎用的な評価指標を用いた報酬の自己生成-センサ入力に対する多面的評価の提案と危険検知の向上-
- 上林拓馬:優先度を用いた複数タスク下における意思決定-報酬との相関関係に基づいたセンサ群を用いた優先度の生成-
- 近藤奏介:Hebb則を用いた複数センサの関連付けによる報酬の自己生成
- 伊藤佳亮:多面的な評価指標を用いた報酬の自己生成-急激な環境変化を考慮した故障判断能力の向上-
- 小野裕也:多面的評価による報酬の自己生成-動的な評価指標の重み付けによる危険検知の実現-
- 須田渉:カウンセリングロボットの頷きタイミングによる傾聴効果の改善-音圧データに基づく個人適応-
- 田浦直通:深層強化学習によるPID制御の実現-ゲインの動的決定によるプラントの性能向上-
- 中村悟:タスク毎のDDPGを用いた行動価値空間における行動選択
- 成田陸矩:単体ロボットにおけるHMARLを用いた行動学習-興味度と確度の切り替えによる探索と知識利用の両立-
- 花形知美:タスクの優先度で重み付けされた行動価値に基づく複数タスク下における意思決定手法の提案
Last-modified: 2023-03-29 (水) 10:47:55