iRobotLab
履歴一覧
差分
を表示
現在との差分
を表示
ソース
を表示
研究/その他/PPL/20190516-01
へ行く。
1 (2019-05-16 (木) 11:06:54)
2 (2019-05-16 (木) 11:08:27)
3 (2019-05-17 (金) 03:27:50)
汎用的な価値観の設計
タスク発見
マルチタスク下での意思決定
単体ロボット内でのマルチエージェントシステム
応用事例
内部構造・ロボットの知的システムに関する研究
目的発見
小橋遼:報酬の差異による単体サブゴール発見手法の提案
多目的下意思決定
柾拓也:複数タスクにおける優先度を用いた行動選択-優先度の動的更新による行動の安定化と効率化-
research_activity_masaki.pdf
大沢航洋:複数タスク下における優先度を用いたロボットの行動選択-ヒステリシスを持つ優先度によるタスク達成の効率化-
research_activity_oosawa.pdf
評価の自己獲得
二階堂芳:外界とのインタラクションによる強化学習の報酬の自己生成
石塚 昌也:センサ入力による報酬の自己生成-予測による好奇心の生成と能動的探索の実現-
research_activity_ishizuka.pdf
伊藤翠那:音入力に対する強さと予測性を用いた報酬の自己生成
research_activity_itoh.pdf
多人格モデル学習
高田陽:反復合議型MARLを用いた単体ロボットの行動学習 -非同期的な意思決定による対故障性の実現-
research_activity_takada.pdf
櫻庭康平:MARLを用いた単体ロボットの行動学習 -エージェントの融合・分離による協調システムの実現-
research_activity_sakuraba.pdf
井上昂浩:単体ロボットにおける行動学習 -効率的な試行錯誤を目指したヘテロジニアスMARLシステムの実現-
research_activity_inoue.pdf
井澤尚志:反復合議型MARLにおける行動学習‐ゆらぎを用いた協調動作の促進‐
research_activity_izawa.pdf
個別学習
澁谷和:強化学習における探査率の動的制御
平間経太:経験情報に基づく不完全知覚の解決-確率的手法による知識量の抑制-
知識獲得・活用
川村一貴:報酬を用いたNNの学習法の提案-ロボットアームに対する行動学習-
北山直樹:センサ情報に基づく動きの知識化-微分情報を用いた動作時間の抽象化-
センサの取捨選択
木島康隆:強化学習におけるセンサの重要度に応じた効率的な意思決定(Efficiently Decision making in reinforcement learning based on importance of sensor)
木村敏久:センサの重要度に応じた学習空間の動的構成
外部構造・ロボットを取り巻く環境に関する研究
状況の未来予測
杉本大志:A Study for State-action Pair Predictions
research_activity_sugimoto.pdf
梅津祐介:複数センサを用いた高精度センシング
知能発現のための環境考察
中南義典:ロボットの認識能力の変化が学習に及ぼす影響について-センサの能力の違いが強化学習の学習効率に及ぼす影響-
内部と外部の相互作用・自己と他者との関係性に関する研究
協調学習(コミュニケーションによる個の発達)
木島康隆:コミュニケーション相手の取捨選択による個体知能の効率的発達
白倉聖也:Adaptation to multi tasks by reflecting person hope degree for importance
research_activity_shirakura.pdf
下口侑也:人-ロボット間の相互作用による達成依頼度の決定-相対評価を用いた個人差への適応-
research_activity_shimoguchi.pdf
今田大聖:カウンセリングロボットによる頷きの傾聴効果の検証-発話量を基とした定量的評価の提案-
research_activity_imada.pdf