研究/その他/PPL/20190516-01 の履歴(No.2) - iRobotLab

履歴一覧
差分を表示
現在との差分を表示
ソースを表示
研究/その他/PPL/20190516-01 へ行く。
- 1 (2019-05-16 (木) 11:06:54)
- 2 (2019-05-16 (木) 11:08:27)
- 3 (2019-05-17 (金) 03:27:50)

汎用的な価値観の設計
タスク発見
マルチタスク下での意思決定
単体ロボット内でのマルチエージェントシステム
応用事例

内部構造・ロボットの知的システムに関する研究
- 目的発見
  - 小橋遼：報酬の差異による単体サブゴール発見手法の提案

多目的下意思決定
- 柾拓也:複数タスクにおける優先度を用いた行動選択-優先度の動的更新による行動の安定化と効率化- research_activity_masaki.pdf
- 大沢航洋:複数タスク下における優先度を用いたロボットの行動選択-ヒステリシスを持つ優先度によるタスク達成の効率化- research_activity_oosawa.pdf

評価の自己獲得
- 二階堂芳:外界とのインタラクションによる強化学習の報酬の自己生成
- 石塚昌也:センサ入力による報酬の自己生成-予測による好奇心の生成と能動的探索の実現- research_activity_ishizuka.pdf
- 伊藤翠那:音入力に対する強さと予測性を用いた報酬の自己生成 research_activity_itoh.pdf

多人格モデル学習
- 高田陽:反復合議型MARLを用いた単体ロボットの行動学習 -非同期的な意思決定による対故障性の実現- research_activity_takada.pdf
- 櫻庭康平:MARLを用いた単体ロボットの行動学習 -エージェントの融合・分離による協調システムの実現- research_activity_sakuraba.pdf
- 井上昂浩:単体ロボットにおける行動学習 -効率的な試行錯誤を目指したヘテロジニアスMARLシステムの実現- research_activity_inoue.pdf
- 井澤尚志:反復合議型MARLにおける行動学習‐ゆらぎを用いた協調動作の促進‐ research_activity_izawa.pdf

個別学習
- 澁谷和：強化学習における探査率の動的制御
- 平間経太：経験情報に基づく不完全知覚の解決-確率的手法による知識量の抑制-

知識獲得・活用
- 川村一貴:報酬を用いたNNの学習法の提案-ロボットアームに対する行動学習-
- 北山直樹：センサ情報に基づく動きの知識化-微分情報を用いた動作時間の抽象化-

センサの取捨選択
- 木島康隆：強化学習におけるセンサの重要度に応じた効率的な意思決定(Efficiently Decision making in reinforcement learning based on importance of sensor)
- 木村敏久：センサの重要度に応じた学習空間の動的構成

外部構造・ロボットを取り巻く環境に関する研究
- 状況の未来予測
  - 杉本大志:A Study for State-action Pair Predictions research_activity_sugimoto.pdf
  - 梅津祐介：複数センサを用いた高精度センシング

知能発現のための環境考察
- 中南義典：ロボットの認識能力の変化が学習に及ぼす影響について-センサの能力の違いが強化学習の学習効率に及ぼす影響-

内部と外部の相互作用・自己と他者との関係性に関する研究
- 協調学習(コミュニケーションによる個の発達)
  - 木島康隆：コミュニケーション相手の取捨選択による個体知能の効率的発達
  - 白倉聖也:Adaptation to multi tasks by reflecting person hope degree for importance research_activity_shirakura.pdf
  - 下口侑也:人-ロボット間の相互作用による達成依頼度の決定-相対評価を用いた個人差への適応- research_activity_shimoguchi.pdf
  - 今田大聖:カウンセリングロボットによる頷きの傾聴効果の検証-発話量を基とした定量的評価の提案- research_activity_imada.pdf