研究/各研究の話/2020年度 のバックアップの現在との差分(No.1)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
#author("2021-04-28T16:34:12+09:00","ldap:nek","nek")
-福澤航大センサ評価の統合による報酬の自己生成 -評価センサの動的選択による危険検知の向上-
#author("2021-04-28T17:11:21+09:00","ldap:nek","nek")
-福澤航大:センサ評価の統合による報酬の自己生成 -評価センサの動的選択による危険検知の向上-
--&ref(research_activity_fukuzawa.pdf);
-松嶋龍文:単体ロボットにおける分散型深層強化学習を用いた行動学習-学習進度に基づく確率的なエージェント選択による効率的探索-
-松嶋龍文:単体ロボットにおける分散型深層強化学習による探索行動の効率化
--&ref(research_activity_matushima.pdf);






-Afiqe Anuar:汎用的な評価指標を用いた報酬の自己生成 -センサ入力に対する多面的評価の提案と危険検知の向上-
-Afiqe Anuar:汎用的な評価指標を用いた報酬の自己生成-センサ入力に対する多面的評価の提案と危険検知の向上-
--&ref(research_activity_afiqe.pdf);
-岡崎優:カウンセリングロボットにおける傾聴効果の改善-強化学習を用いた頷き回数の学習-
--&ref(research_activity_okazaki.pdf);
-上林拓馬:優先度を用いた複数タスク下における意思決定-優先度の部分設計による環境への適応性の向上-
-上林拓馬:優先度を用いた複数タスク下における意思決定-報酬との相関関係に基づいたセンサ群を用いた優先度の生成-
--&ref(research_activity_kanbayashi.pdf);
-後藤成海:単体ロボットにおけるHMARLを用いた行動学習-行動数の増加に応じたエージェントの除外による学習効率の向上-
--&ref(research_activity_gotoh.pdf);
-近藤奏介:Hebb則を用いた複数センサの関連付けによる報酬の自己生成
--&ref(research_activity_kondo.pdf);
-佐藤響介:深層強化学習を用いたPID制御の性能向上 -目標値に応じたゲインの動的決定-
--&ref(research_activity_satoh.pdf);
-飛世賢宏:複数タスク下におけるロボットの意思決定-探索タスク導入による学習効率の向上-
--&ref(research_activity_tobise.pdf);
-伊藤佳亮:多面的な評価指標を用いた報酬の自己生成-急激な環境変化を考慮した故障判断能力の向上-
--&ref(research_activity_ito.pdf);
-小野裕也:多面的評価による報酬の自己生成-動的な評価指標の重み付けによる危険検知の実現-
--&ref(research_activity_ono.pdf);
-須田渉:カウンセリングロボットの頷きタイミングによる傾聴効果の改善-音圧データに基づく個人適応-
--&ref(research_activity_suda.pdf);
-田浦直通:深層強化学習によるPID制御の実現-ゲインの動的決定によるプラントの性能向上-
--&ref(research_activity_taura.pdf);
-中村悟:タスク毎のDDPGを用いた行動価値空間における行動選択
--&ref(research_activity_nakamura.pdf);
-成田陸矩:単体ロボットにおけるHMARLを用いた行動学習-興味度と確度の切り替えによる探索と知識利用の両立-
--&ref(research_activity_narita.pdf);
-花形知美:タスクの優先度で重み付けされた行動価値に基づく複数タスク下における意思決定手法の提案
--&ref(research_activity_hanagata.pdf);