研究/その他/Archives/畑中・佐賀・本田・倉重ラウンジトーク2012

2018-04-16 (月) 15:53:00 (1287d)

全体(研究室)の方向性

対象とする知能ロボット

当研究室では「知能ロボット」の実現に向けて日々研究を行っています.その出発点ともなるべき問が,「知能って何?」です.

知能って何?.jpg

知能を持っているものとして皆さんがまず思いつくのは,「人間」だと思います.人間には高度な情報処理ができます.コミュニケーションや推論,学習して知識を増やすことも得た知識を用いて想像することもできるとされています.恐らく一般的な印象としては,これら様々な能力を総称して「知能」である,というものだと思います.それでは,「知能」的であるために必要な能力とは何なのでしょう?どのような能力がどのくらいあれば「知能」があると言えるのでしょう?また一つ一つの能力を見ても,ある/ないの二択ではありません.コミュニケーション能力を例にとっても,高い能力のある人もいれば,全くないわけではないが...という人もいます.

更に,意見の分かれていくところですが,動物にも知能がある,と感じる人もいます.身近なところでは犬・猫に知能を感じる人も多いのではないでしょうか?しかし人間がもつ能力と犬・猫がもつ能力とを同じように比較することは困難です.それでも,「知能があるか?ないか」という判断を人間は行うことが出来ます.では,犬や猫ではなく,昆虫ではどうでしょう?昆虫には昆虫独自の能力が沢山あります.この場合はどうでしょう?

このように人間同士や人間と比較的人間に近いものとの間では,「知能」の有無の判断は容易です.しかし異なる種同士であればあるほど「知能」の判断は困難になっていきます.なぜでしょうか?

私達は,(少なくとも)人間は「知能」を直接見ること・感じることができないからである,と考えています.身振り手振りや表情,発話などの身体の振る舞いによって間接的に「知能」を感じることのみができるのだと考えます.

知能については各分野の人々が古くから考察を行ってきています(哲学が代表でしょう).しかし現在に至るまで万人が納得する答えは出ていません.つまり,現段階ですぐに「知能」を知り,「知能」を持ったロボットを実現することは大変困難です.そこで,「知能」的かを判断する身体の振る舞いに注目します.そして,「知能」を感じさせる身体の振る舞いとはどういうものかを考え,機械(特にロボット)に実装し,はたして振る舞いによって「知能」を感じさせてくれるのかを検証し,「知能的な振る舞い」の実現を行っていきたいと思っています.

振る舞いを通して「知能」を考える.png

我々の研究の方向性としては,複雑な環境下において十分に適応し活動し続けるロボットの実現を目指しています.そして,その中でロボットの動き・振る舞いを通して「知能」とは何かを考えていきます.

これらをふまえて具体的な研究の方向としては,

  • 人により環境に応じて動くシステムの構築
  • 様々な手法を用いて環境に適応するシステムの構築
  • 環境に適応するための新しい概念・手法などの提案

があります.

研究の方向性.png

対象となる研究領域

振る舞いを通してロボットの知能を考えていく時,重要となるのが環境との相互作用です.「動く」ということは環境への適応の手段であり,環境を変化させる力です.これはロボットから環境への作用です.これに,環境変化に伴って環境に適応するためにロボット自身が変化するメカニズム(環境からロボットへの作用),これが機能したときに環境との相互作用が成り立ちます.

短期的には

  • ロボット ⇒ 環境:
    • ロボットの動きによる一時的な環境変化
  • 環境 ⇒ ロボット:
    • 環境変化に対する適切な動きの知識の獲得

が考えられますが,更に長期的視点として

  • ロボット ⇒ 環境:
    • ロボットの動きによる不可逆的な環境変化
  • 環境 ⇒ ロボット:
    • 環境変化に適応するための自身の構造の変化

などが考えられます.

更に,継続的な相互作用が起こることによって,ロボットと環境の継続的な適応・変化が起こり,新たなロボット・新たな環境の創発が起こることが期待されています.そのために,よりよい相互作用とは何か?よい相互作用を実現するにはどうしたらよいか?が考えられています.

Cognitive Developmental Robotics.png

テーマ分類

現在のテーマ

大分類

認知発達ロボティクスの考えをもとに,現在行っている研究としては,ロボットの内部構造にあたる自律機能形成と外部環境に関する環境評価です.詳しくはこちら

  • 内部構造・ロボットの知的システムに関する研究
研究の概要2.png

認知発達ロボティクスの考えをもとに,現在行っている研究としては,ロボットの内部構造にあたる自律機能形成と外部環境に関する環境評価です.詳しくはこちら

研究の概要.png

これまでのテーマ一覧

  • 2020年度
    • 福澤航大:センサ評価の統合による報酬の自己生成 -評価センサの動的選択による危険検知の向上-
    • 松嶋龍文:単体ロボットにおける分散型深層強化学習による探索行動の効率化
    • Afiqe Anuar:汎用的な評価指標を用いた報酬の自己生成-センサ入力に対する多面的評価の提案と危険検知の向上-
    • 上林拓馬:優先度を用いた複数タスク下における意思決定-報酬との相関関係に基づいたセンサ群を用いた優先度の生成-
    • 近藤奏介:Hebb則を用いた複数センサの関連付けによる報酬の自己生成
    • 伊藤佳亮:多面的な評価指標を用いた報酬の自己生成-急激な環境変化を考慮した故障判断能力の向上-
    • 小野裕也:多面的評価による報酬の自己生成-動的な評価指標の重み付けによる危険検知の実現-
    • 須田渉:カウンセリングロボットの頷きタイミングによる傾聴効果の改善-音圧データに基づく個人適応-
    • 田浦直通:深層強化学習によるPID制御の実現-ゲインの動的決定によるプラントの性能向上-
    • 中村悟:タスク毎のDDPGを用いた行動価値空間における行動選択
    • 成田陸矩:単体ロボットにおけるHMARLを用いた行動学習-興味度と確度の切り替えによる探索と知識利用の両立-
    • 花形知美:タスクの優先度で重み付けされた行動価値に基づく複数タスク下における意思決定手法の提案

中間発表について

杉本君のこれから.

  • 生き物は,複雑な環境下で素早く適切な行動を行うために,「予測」を使っている.事前に感覚器からの入力を予測することで,事前に適切な行動を選定し,
    • 素早く行動を実現する(時間を短縮させている)
    • 行動決定のコストを下げる(感覚-行動の汎化により無意識下での行動選択を実現させている)
  • ことを行っていると考えられている.

対象領域における研究

  • NN等を用いた環境のモデル学習とそれによる行動選択
    • NNによる未来における適切な行動の学習を行う.
  • 階層型学習システムによる行動選択
    • 下位となるモジュール群が現状態に対する行動選択を行う.上位のモジュールは下位のモジュールが適切な行動を選択するか予測し,環境ごとに使用するモジュールを選択する.
  • ロボットによる意識・無意識の研究
    • 学習手法による行動選択時に,意識・無意識下での行動選択とは何か,を論じている.特に,学習手法によって適切な行動を選択できている場合には,反射行動に近く,無意識下での動作と考えている.また,適切な行動が出来なかった時に再学習を行う必要が出てきて「学習」が表立って機能することから,これを意識的行動選択と考えている.この意識・無意識的行動選択をもって,生き物の意識・無意識的行動選択と比較を行う研究である.

杉本君の方向性

  • 環境が変化し続け,環境認識に対する行動決定に時間的制約がある状況下では,素早く最適な行動選択を行う必要がある(素早い学習とは別の話).現状態を認識し,それに対する行動選択を行う場合,どんなに頑張ってもゼロ時間での反応は不可能である.そこで,事前に環境を予測し,取るべき行動を大まかにでも決定しておくことで,
    • ゼロ時間での反応
    • 短時間での探索
  • を行えることを目標とする.
  • まとめ
    • (短期/長期での)未来の環境を予測し,それに対する行動を探索しておくことで,短時間での最適な行動選択を可能とする.

現状とこれから

現状

  • 未来予測が出来るか
    • 難しさ
      • 環境自体はロボット自身の選択した行動に影響する.よって未来の環境を予測する場合,未来にとる行動を予測し考慮に入れて未来の環境を予測する必要がある.

博士期間

  • 未来予測の活用方法
    • 短期の未来予測を活用し,制御レベルでの行動選択を行う.
    • 長期の未来予測を活用し,タスク単位の行動選択を行う.