研究/その他/PPL/20190516-01

2020-05-08 (金) 15:26:44 (29d)
  • 汎用的な価値観の設計
    • 二階堂芳:外界とのインタラクションによる強化学習の報酬の自己生成
    • 石塚 昌也:複数センサを用いた報酬の自己生成-危険回避を重視したセンサの重要度の決定-
    • 福澤航大:複数センサを用いた報酬の自己生成 -少数センサの単体評価とセンサ間の関連付けによる報酬生成-
    • Afiqe Anuar:汎用的な評価指標を用いた報酬の自己生成 -センサ入力に対する多面的評価の提案と危険検知の向上-
    • 近藤奏介:Hebb則を用いた複数センサの関連付けによる報酬の自己生成
  • タスク発見
    • 下口侑也:欲求-動機モデルを用いたロボットの意思決定~評価とセンサの相関関係に基づくタスクの自律獲得
    • 白倉聖也:環境変化に起因する報酬構造の変化への適応〜ロボットの学習空間の生成・選択による再学習の回避〜
  • マルチタスク下での意思決定
    • 大沢航洋:優先度を用いた複数タスク下の意思決定-行動の細分化による効率的なタスク達成の実現-
    • 下口侑也:欲求-動機モデルを用いたロボットの意思決定~評価とセンサの相関関係に基づくタスクの自律獲得
    • 白倉聖也:Adaptation to multi tasks by reflecting person hope degree for importance
    • 上林拓馬:優先度を用いた複数タスク下における意思決定-優先度の部分設計による環境への適応性の向上-
    • 飛世賢宏:複数タスク下におけるロボットの意思決定-探索タスク導入による学習効率の向上-
  • 単体ロボット内でのマルチエージェントシステム
    • 井上昂浩:MARLによる単体ロボットにおける行動学習 -幾何的拘束に起因した疑似学習空間の形成による学習性能の向上-
    • 松嶋龍文:単体ロボットにおける分散型深層強化学習を用いた行動学習-学習進度に基づく確率的なエージェント選択による効率的探索-
    • 後藤成海:単体ロボットにおけるHMARLを用いた行動学習-行動数の増加に応じたエージェントの除外による学習効率の向上-
  • 応用事例
    • 岡崎優:カウンセリングロボットにおける傾聴効果の改善-強化学習を用いた頷き回数の学習-
    • 佐藤響介:深層強化学習を用いたPID制御の性能向上 -目標値に応じたゲインの動的決定-