- Afiqe Anuar bin Muhammad Nor Hakim:汎用的な評価指標を用いた報酬の自己生成 -センサ入力に対する多面的評価の提案と危険検知の向上-
- 小野裕也:センサ情報に基づく評価の自己生成-評価指標の限定による危険認識能力の向上-
- 成田陸矩:異なる認識能力を持つエージェント群による単体ロボットの意思決定-知識の転移を用いた候補行動の絞り込みによる効率的な探索-
- 花形知美:複数タスク下における意思決定手法の適応力向上〜タスク間の関係を考慮した行動選択手法の提案〜
- 上村優真:単体ロボットにおけるHMARLを用いた行動学習-情報エントロピーを用いたエージェントの絞り込みによる学習性能の向上-
- 坂本悠真:センサ入力の性質に基づいた入力強度の適応度調整による評価の自己生成の提案
- 大沼郁斗:異なる認識能力を持つエージェント群による単体ロボットの意思決定-学習空間の信頼性に応じた各行動における選択確率への重み付けによる効率的な探索の実現-
- 川俣俊:マルチタスク強化学習におけるタスクの優先度に基づいた行動選択手法の提案-2 つの要因を考慮した優先度の設計によるタスク遂行能力の向上-
- 坂本喜城:センサ情報に基づく評価の自己生成‐入れ替え更新トレースに基づいた評価指標によるセンサ入力に対するロバスト性の向上‐
- 佐久間聖人:複数タスクを持つロボットの意思決定手法の提案-TD 誤差に基づく優先度を用いた探索タスクによる動的環境への適応性の向上-
- 横田楓:多面的な評価指標を用いた評価の自己生成-予測誤差に基づく好奇心と恐怖心の導入による環境への適応能力向上-
Last-modified: 2023-05-01 (月) 01:02:42