研究/その他/Archives/畑中・佐賀・本田・倉重ラウンジトーク2012
全体(研究室)の方向性 †
対象とする知能ロボット †
当研究室では「知能ロボット」の実現に向けて日々研究を行っています.その出発点ともなるべき問が,「知能って何?」です.
知能を持っているものとして皆さんがまず思いつくのは,「人間」だと思います.人間には高度な情報処理ができます.コミュニケーションや推論,学習して知識を増やすことも得た知識を用いて想像することもできるとされています.恐らく一般的な印象としては,これら様々な能力を総称して「知能」である,というものだと思います.それでは,「知能」的であるために必要な能力とは何なのでしょう?どのような能力がどのくらいあれば「知能」があると言えるのでしょう?また一つ一つの能力を見ても,ある/ないの二択ではありません.コミュニケーション能力を例にとっても,高い能力のある人もいれば,全くないわけではないが...という人もいます.
更に,意見の分かれていくところですが,動物にも知能がある,と感じる人もいます.身近なところでは犬・猫に知能を感じる人も多いのではないでしょうか?しかし人間がもつ能力と犬・猫がもつ能力とを同じように比較することは困難です.それでも,「知能があるか?ないか」という判断を人間は行うことが出来ます.では,犬や猫ではなく,昆虫ではどうでしょう?昆虫には昆虫独自の能力が沢山あります.この場合はどうでしょう?
このように人間同士や人間と比較的人間に近いものとの間では,「知能」の有無の判断は容易です.しかし異なる種同士であればあるほど「知能」の判断は困難になっていきます.なぜでしょうか?
私達は,(少なくとも)人間は「知能」を直接見ること・感じることができないからである,と考えています.身振り手振りや表情,発話などの身体の振る舞いによって間接的に「知能」を感じることのみができるのだと考えます.
知能については各分野の人々が古くから考察を行ってきています(哲学が代表でしょう).しかし現在に至るまで万人が納得する答えは出ていません.つまり,現段階ですぐに「知能」を知り,「知能」を持ったロボットを実現することは大変困難です.そこで,「知能」的かを判断する身体の振る舞いに注目します.そして,「知能」を感じさせる身体の振る舞いとはどういうものかを考え,機械(特にロボット)に実装し,はたして振る舞いによって「知能」を感じさせてくれるのかを検証し,「知能的な振る舞い」の実現を行っていきたいと思っています.
我々の研究の方向性としては,複雑な環境下において十分に適応し活動し続けるロボットの実現を目指しています.そして,その中でロボットの動き・振る舞いを通して「知能」とは何かを考えていきます.
これらをふまえて具体的な研究の方向としては,
- 人により環境に応じて動くシステムの構築
- 様々な手法を用いて環境に適応するシステムの構築
- 環境に適応するための新しい概念・手法などの提案
があります.
対象となる研究領域 †
振る舞いを通してロボットの知能を考えていく時,重要となるのが環境との相互作用です.「動く」ということは環境への適応の手段であり,環境を変化させる力です.これはロボットから環境への作用です.これに,環境変化に伴って環境に適応するためにロボット自身が変化するメカニズム(環境からロボットへの作用),これが機能したときに環境との相互作用が成り立ちます.
短期的には
- ロボット ⇒ 環境:
- ロボットの動きによる一時的な環境変化
- 環境 ⇒ ロボット:
- 環境変化に対する適切な動きの知識の獲得
が考えられますが,更に長期的視点として
- ロボット ⇒ 環境:
- ロボットの動きによる不可逆的な環境変化
- 環境 ⇒ ロボット:
- 環境変化に適応するための自身の構造の変化
などが考えられます.
更に,継続的な相互作用が起こることによって,ロボットと環境の継続的な適応・変化が起こり,新たなロボット・新たな環境の創発が起こることが期待されています.そのために,よりよい相互作用とは何か?よい相互作用を実現するにはどうしたらよいか?が考えられています.
テーマ分類 †
現在のテーマ †
大分類 †
認知発達ロボティクスの考えをもとに,現在行っている研究としては,ロボットの内部構造にあたる自律機能形成と外部環境に関する環境評価です.詳しくはこちら.
- 内部構造・ロボットの知的システムに関する研究
- 知識活用
- 外部構造・ロボットを取り巻く環境に関する研究
- 内部と外部の相互作用・自己と他者との関係性に関する研究
- センサを通した内部と外部の関係性の創発
- コミュニケーションによる個の発達
認知発達ロボティクスの考えをもとに,現在行っている研究としては,ロボットの内部構造にあたる自律機能形成と外部環境に関する環境評価です.詳しくはこちら.
これまでのテーマ一覧 †
- 2019年度
- 井上昂浩:MARLによる単体ロボットにおける行動学習 -幾何的拘束に起因した疑似学習空間の形成による学習性能の向上-
- 大沢航洋:優先度を用いた複数タスク下の意思決定-行動の細分化による効率的なタスク達成の実現-
- 下口侑也:欲求-動機モデルを用いたロボットの意思決定~評価とセンサの相関関係に基づくタスクの自律獲得
- 福澤航大:複数センサを用いた報酬の自己生成 -少数センサの単体評価とセンサ間の関連付けによる報酬生成-
- 松嶋龍文:単体ロボットにおける分散型深層強化学習を用いた行動学習-学習進度に基づく確率的なエージェント選択による効率的探索-
- Afiqe Anuar:汎用的な評価指標を用いた報酬の自己生成 -センサ入力に対する多面的評価の提案と危険検知の向上-
- 岡崎優:カウンセリングロボットにおける傾聴効果の改善-強化学習を用いた頷き回数の学習-
- 上林拓馬:優先度を用いた複数タスク下における意思決定-優先度の部分設計による環境への適応性の向上-
- 後藤成海:単体ロボットにおけるHMARLを用いた行動学習-行動数の増加に応じたエージェントの除外による学習効率の向上-
- 近藤奏介:Hebb則を用いた複数センサの関連付けによる報酬の自己生成
- 佐藤響介:深層強化学習を用いたPID制御の性能向上 -目標値に応じたゲインの動的決定-
- 飛世賢宏:複数タスク下におけるロボットの意思決定-探索タスク導入による学習効率の向上-
中間発表について †
杉本君のこれから. †
- 生き物は,複雑な環境下で素早く適切な行動を行うために,「予測」を使っている.事前に感覚器からの入力を予測することで,事前に適切な行動を選定し,
- 素早く行動を実現する(時間を短縮させている)
- 行動決定のコストを下げる(感覚-行動の汎化により無意識下での行動選択を実現させている)
- ことを行っていると考えられている.
対象領域における研究 †
- NN等を用いた環境のモデル学習とそれによる行動選択
- NNによる未来における適切な行動の学習を行う.
- 階層型学習システムによる行動選択
- 下位となるモジュール群が現状態に対する行動選択を行う.上位のモジュールは下位のモジュールが適切な行動を選択するか予測し,環境ごとに使用するモジュールを選択する.
- ロボットによる意識・無意識の研究
- 学習手法による行動選択時に,意識・無意識下での行動選択とは何か,を論じている.特に,学習手法によって適切な行動を選択できている場合には,反射行動に近く,無意識下での動作と考えている.また,適切な行動が出来なかった時に再学習を行う必要が出てきて「学習」が表立って機能することから,これを意識的行動選択と考えている.この意識・無意識的行動選択をもって,生き物の意識・無意識的行動選択と比較を行う研究である.
杉本君の方向性 †
- 環境が変化し続け,環境認識に対する行動決定に時間的制約がある状況下では,素早く最適な行動選択を行う必要がある(素早い学習とは別の話).現状態を認識し,それに対する行動選択を行う場合,どんなに頑張ってもゼロ時間での反応は不可能である.そこで,事前に環境を予測し,取るべき行動を大まかにでも決定しておくことで,
- ゼロ時間での反応
- 短時間での探索
- を行えることを目標とする.
- まとめ
- (短期/長期での)未来の環境を予測し,それに対する行動を探索しておくことで,短時間での最適な行動選択を可能とする.
現状とこれから †
現状 †
- 未来予測が出来るか
- 難しさ
- 環境自体はロボット自身の選択した行動に影響する.よって未来の環境を予測する場合,未来にとる行動を予測し考慮に入れて未来の環境を予測する必要がある.
- 難しさ
博士期間 †
- 未来予測の活用方法
- 短期の未来予測を活用し,制御レベルでの行動選択を行う.
- 長期の未来予測を活用し,タスク単位の行動選択を行う.