全体(研究室)の方向性

対象とする知能ロボット

当研究室では「知能ロボット」の実現に向けて日々研究を行っています.その出発点ともなるべき問が,「知能って何?」です.

知能って何?.jpg

知能を持っているものとして皆さんがまず思いつくのは,「人間」だと思います.人間には高度な情報処理ができます.コミュニケーションや推論,学習して知識を増やすことも得た知識を用いて想像することもできるとされています.恐らく一般的な印象としては,これら様々な能力を総称して「知能」である,というものだと思います.それでは,「知能」的であるために必要な能力とは何なのでしょう?どのような能力がどのくらいあれば「知能」があると言えるのでしょう?また一つ一つの能力を見ても,ある/ないの二択ではありません.コミュニケーション能力を例にとっても,高い能力のある人もいれば,全くないわけではないが...という人もいます.

更に,意見の分かれていくところですが,動物にも知能がある,と感じる人もいます.身近なところでは犬・猫に知能を感じる人も多いのではないでしょうか?しかし人間がもつ能力と犬・猫がもつ能力とを同じように比較することは困難です.それでも,「知能があるか?ないか」という判断を人間は行うことが出来ます.では,犬や猫ではなく,昆虫ではどうでしょう?昆虫には昆虫独自の能力が沢山あります.この場合はどうでしょう?

このように人間同士や人間と比較的人間に近いものとの間では,「知能」の有無の判断は容易です.しかし異なる種同士であればあるほど「知能」の判断は困難になっていきます.なぜでしょうか?

私達は,(少なくとも)人間は「知能」を直接見ること・感じることができないからである,と考えています.身振り手振りや表情,発話などの身体の振る舞いによって間接的に「知能」を感じることのみができるのだと考えます.

知能については各分野の人々が古くから考察を行ってきています(哲学が代表でしょう).しかし現在に至るまで万人が納得する答えは出ていません.つまり,現段階ですぐに「知能」を知り,「知能」を持ったロボットを実現することは大変困難です.そこで,「知能」的かを判断する身体の振る舞いに注目します.そして,「知能」を感じさせる身体の振る舞いとはどういうものかを考え,機械(特にロボット)に実装し,はたして振る舞いによって「知能」を感じさせてくれるのかを検証し,「知能的な振る舞い」の実現を行っていきたいと思っています.

振る舞いを通して「知能」を考える.png

我々の研究の方向性としては,複雑な環境下において十分に適応し活動し続けるロボットの実現を目指しています.そして,その中でロボットの動き・振る舞いを通して「知能」とは何かを考えていきます.

これらをふまえて具体的な研究の方向としては,

  • 人により環境に応じて動くシステムの構築
  • 様々な手法を用いて環境に適応するシステムの構築
  • 環境に適応するための新しい概念・手法などの提案

があります.

研究の方向性.png

対象となる研究領域

振る舞いを通してロボットの知能を考えていく時,重要となるのが環境との相互作用です.「動く」ということは環境への適応の手段であり,環境を変化させる力です.これはロボットから環境への作用です.これに,環境変化に伴って環境に適応するためにロボット自身が変化するメカニズム(環境からロボットへの作用),これが機能したときに環境との相互作用が成り立ちます.

短期的には

  • ロボット ⇒ 環境:
    • ロボットの動きによる一時的な環境変化
  • 環境 ⇒ ロボット:
    • 環境変化に対する適切な動きの知識の獲得

が考えられますが,更に長期的視点として

  • ロボット ⇒ 環境:
    • ロボットの動きによる不可逆的な環境変化
  • 環境 ⇒ ロボット:
    • 環境変化に適応するための自身の構造の変化

などが考えられます.

更に,継続的な相互作用が起こることによって,ロボットと環境の継続的な適応・変化が起こり,新たなロボット・新たな環境の創発が起こることが期待されています.そのために,よりよい相互作用とは何か?よい相互作用を実現するにはどうしたらよいか?が考えられています.

Cognitive Developmental Robotics.png

テーマ分類

現在のテーマ

大分類

認知発達ロボティクスの考えをもとに,現在行っている研究としては,ロボットの内部構造にあたる自律機能形成と外部環境に関する環境評価です.詳しくはこちら

  • 内部構造・ロボットの知的システムに関する研究
研究の概要2.png

認知発達ロボティクスの考えをもとに,現在行っている研究としては,ロボットの内部構造にあたる自律機能形成と外部環境に関する環境評価です.詳しくはこちら

研究の概要.png

これまでのテーマ一覧

  • 2016年度
    • 高田陽:反復合議型MARL における非同期的な意思決定-信頼度を用いた故障エージェントへの対応-
    • 柾拓也:各タスクの優先度を用いた行動選択 -動的な優先度の更新による行動選択の効率化-
    • 石塚昌也:センサ入力に対する予測性の評価を用いた報酬の自己生成手法の提案 -SVR による予測性の改善-
    • 櫻庭康平:反復合議型MARL における単体ロボットの行動学習 -学習手法間における比較検証-
    • 白倉聖也:人からの教示による報酬の自己生成〜マルチタスクへの適応〜
    • 関恵莉菜:Counseling Agent における頷き動作を用いた人との信頼関係の構築
    • 本間啓暉:複数タスクにおけるロボットの行動学習 -行動停止回数を基にしたパラメータの推奨領域の限定-
  • 2014年度
    • 杉本大志:A Study on the State-Action Pair Prediction for Robot
    • 二階堂芳:外界とのインタラクションによる強化学習の報酬の自己生成
    • 小橋遼:複数タスクに対する意思決定手法の提案 〜外界とのインタラクションによるタスクの重要度の制御〜
    • 千葉秀平:反復合議型意思決定法によるマルチエージェント強化学習
    • 川村一貴:報酬を用いたNNの学習法の提案-ロボットアームに対する行動学習-
    • 櫻井柊平:反復合議型意思決定法を用いた行動学習―物理シミュレータによる耐故障性の検証―

中間発表について

杉本君のこれから.

  • 生き物は,複雑な環境下で素早く適切な行動を行うために,「予測」を使っている.事前に感覚器からの入力を予測することで,事前に適切な行動を選定し,
    • 素早く行動を実現する(時間を短縮させている)
    • 行動決定のコストを下げる(感覚-行動の汎化により無意識下での行動選択を実現させている)
  • ことを行っていると考えられている.

対象領域における研究

  • NN等を用いた環境のモデル学習とそれによる行動選択
    • NNによる未来における適切な行動の学習を行う.
  • 階層型学習システムによる行動選択
    • 下位となるモジュール群が現状態に対する行動選択を行う.上位のモジュールは下位のモジュールが適切な行動を選択するか予測し,環境ごとに使用するモジュールを選択する.
  • ロボットによる意識・無意識の研究
    • 学習手法による行動選択時に,意識・無意識下での行動選択とは何か,を論じている.特に,学習手法によって適切な行動を選択できている場合には,反射行動に近く,無意識下での動作と考えている.また,適切な行動が出来なかった時に再学習を行う必要が出てきて「学習」が表立って機能することから,これを意識的行動選択と考えている.この意識・無意識的行動選択をもって,生き物の意識・無意識的行動選択と比較を行う研究である.

杉本君の方向性

  • 環境が変化し続け,環境認識に対する行動決定に時間的制約がある状況下では,素早く最適な行動選択を行う必要がある(素早い学習とは別の話).現状態を認識し,それに対する行動選択を行う場合,どんなに頑張ってもゼロ時間での反応は不可能である.そこで,事前に環境を予測し,取るべき行動を大まかにでも決定しておくことで,
    • ゼロ時間での反応
    • 短時間での探索
  • を行えることを目標とする.
  • まとめ
    • (短期/長期での)未来の環境を予測し,それに対する行動を探索しておくことで,短時間での最適な行動選択を可能とする.

現状とこれから

現状

  • 未来予測が出来るか
    • 難しさ
      • 環境自体はロボット自身の選択した行動に影響する.よって未来の環境を予測する場合,未来にとる行動を予測し考慮に入れて未来の環境を予測する必要がある.

博士期間

  • 未来予測の活用方法
    • 短期の未来予測を活用し,制御レベルでの行動選択を行う.
    • 長期の未来予測を活用し,タスク単位の行動選択を行う.