研究/その他/Archives/3年生研究課題調査研究紹介用

2019-05-17 (金) 12:28:38 (122d)

当研究室で行っている研究の概要

  • 生き物の持つ知能を実現したい!

対象とする知能ロボット

当研究室では「知能ロボット」の実現に向けて日々研究を行っています.その出発点ともなるべき問が,「知能って何?」です.

知能って何?.jpg

知能を持っているものとして皆さんがまず思いつくのは,「人間」だと思います.人間には高度な情報処理ができます.コミュニケーションや推論,学習して知識を増やすことも得た知識を用いて想像することもできるとされています.恐らく一般的な印象としては,これら様々な能力を総称して「知能」である,というものだと思います.それでは,「知能」的であるために必要な能力とは何なのでしょう?どのような能力がどのくらいあれば「知能」があると言えるのでしょう?また一つ一つの能力を見ても,ある/ないの二択ではありません.コミュニケーション能力を例にとっても,高い能力のある人もいれば,全くないわけではないが...という人もいます.

更に,意見の分かれていくところですが,動物にも知能がある,と感じる人もいます.身近なところでは犬・猫に知能を感じる人も多いのではないでしょうか?しかし人間がもつ能力と犬・猫がもつ能力とを同じように比較することは困難です.それでも,「知能があるか?ないか」という判断を人間は行うことが出来ます.では,犬や猫ではなく,昆虫ではどうでしょう?昆虫には昆虫独自の能力が沢山あります.この場合はどうでしょう?

このように人間同士や人間と比較的人間に近いものとの間では,「知能」の有無の判断は容易です.しかし異なる種同士であればあるほど「知能」の判断は困難になっていきます.なぜでしょうか?

私達は,(少なくとも)人間は「知能」を直接見ること・感じることができないからである,と考えています.身振り手振りや表情,発話などの身体の振る舞いによって間接的に「知能」を感じることのみができるのだと考えます.

知能については各分野の人々が古くから考察を行ってきています(哲学が代表でしょう).しかし現在に至るまで万人が納得する答えは出ていません.つまり,現段階ですぐに「知能」を知り,「知能」を持ったロボットを実現することは大変困難です.そこで,「知能」的かを判断する身体の振る舞いに注目します.そして,「知能」を感じさせる身体の振る舞いとはどういうものかを考え,機械(特にロボット)に実装し,はたして振る舞いによって「知能」を感じさせてくれるのかを検証し,「知能的な振る舞い」の実現を行っていきたいと思っています.

振る舞いを通して「知能」を考える.png

動くことの難しさ

「知能的な振る舞い」を私達は,「身体による知能の表現」と捉えます.よって自転車にのったり運動をしたりという動きはもちろんのこと,考え込んだり本を読んだりという動きの少ないものも「知能的な振る舞い」と捉えます.特に後者の場合,そのような動きを通して見ることのできる脳みその内部の情報処理メカニズムを「知能的な振る舞い」と考えることが多いと思います. そこで私達の研究室では,「動き」に注目し,「動き」をつくり出すメカニズムまで含めて「知能的な振る舞い」と考え,実現していきたいと思っています.

ここで,「動き」について考えてみます.

コップをとる動き,ドアをあける動き,お手玉をする動き,様々な動きがあります.人間が行っている動きを正確に記録し,人間と同じ機構をもつロボットで再現してやるとどうなるでしょう?ちゃんと「動く」のでしょうか?もちろんロボットの体は「動き」ます.しかし,コップをとる動き,ドアをあける動き,お手玉をする動き,となるのでしょうか?周りの状況までも人間が動いた時と完全に同じにすれば,意味のある動きとなるかもしれません.しかし多くは,コップをつかみそこなった,あける途中でドアが引っかかった,お手玉がどっかに飛んでいった,といった失敗の動きになると思います.

人間は動くときに,「まわりの環境」に合わせて動くことができます.置いてあるコップに合わせて手の位置を修正し,握力も調整し,にぎることができます.むしろ人間にとって,「まわりの環境と全く無関係に動く」ことは難しいものです.一方,機械・ロボットにとって後者の方が簡単であり,「まわりの環境」に合わせて動くことは大変難しいことです.なぜなら,「まわりの環境」は,「未知なる環境」だからです.ここで言う「未知なる環境」とは,見たことも聞いたこともない環境のことではありません.過去になんども同じような環境・状況を経験しており,沢山の予備知識を持っているけれども,全く同じ環境・状況ではない故に,未知なる要素がわずかでも入っている,そんな環境です.昨日コップをつかんだ環境とは,今日は場所が違う・重さが違う・コップが違う.恐らく一つ一つの要素は,数mm,数mg,数mlくらいの違いかもしれませんが,沢山の数ミリ違う要素が存在する環境は過去のどの環境とも違うのです.私達の囲まれている実環境は,無限の環境パターンを許容するくらい,複雑なのです.

人間は,このよく馴染んだ未知の日常環境の中で動きを創造し続けて生きています.そのメカニズムは何か?それを考え,創り,ロボットを用いて動かす.これが現在,私達が研究している事柄です.

動作することの難しさ.png

これからのロボットが直面する環境:実環境

これまでにロボットが用いられてきた環境は非常に限定的でした.

社会で用いられているロボットは工場のラインで使用されているロボットが主であり,単調な仕事を限定的な環境で行うものです.この限定的な環境,というのは,なるべく人が入らず,突発的な変化が起こらず,毎日同じ状況を再現している環境です.

一方,研究・開発で用いられるロボットは,初期はシミュレーション(コンピュータ内に構築した仮想環境下)で動かされていました.現在もシミュレーションは重要な役割を担っていますが,次第に実機を用いた研究・開発も行われるようになってきています.その際,実機が用いられる環境は,ロボットが動きやすいように外乱・ノイズがあまりなく,実験毎に同じ状況を再現できるように整えられます.

このような工場等での環境,シミュレーション,および研究開発における実験環境における特徴は,人が環境をコントロールすることができ,ロボットを用いる前にどのような環境であるのかを予想することができることです.環境をコントロールすることでロボットの用い方は飛躍的に簡単になります(それでも難しいのですが).

しかし,ロボットの適用範囲を広げ,より身近に,より便利に用いるためには整えられた環境から私達が生活している実際の環境でロボットが動作することが必要になってきます.ここで,私達が生活している環境,とはロボットのために特別に用意された空間ではなく,私達が物理的に移動可能な空間全てを指します.それは,私達が住む一般家庭内で動くことから,究極は他の惑星に行って動くことまで対象になります.その難しさは,複雑性(関連する要因が無限にある),リアルタイム性(時間に応じて不可逆的に変化していくため時間制約が存在する),開放性(何かを考える時に無視してよい環境とそうでない環境とに分けることができない)などがあります.

ロボットが直面する環境 実環境.png

適応できなければ生きていけない・生き続けられない

一般に,ロボットが直面する実環境は非常に複雑です.それは環境には,「膨大な要因」と「不可逆な変化である時間の流れ」が存在しているためです.

それに対して,ロボットには様々な拘束条件があります.特に身体的な拘束条件としては,どのような身体構造を持つのか,その身体構造を駆動させるデバイスは何か,デバイスの発生できる力はどの程度か,周囲を知覚するセンサは何か?,それらセンサは身体のどこにどのように付いているのか?,それらセンサが知覚できる範囲はどの程度か? 身体が異なるロボットでは当然異なる制約が課せられますが,同じロボットであっても全く同一の身体をつくることは不可能であり,微少ながら身体に違いがうまれ,それゆえ制約に違いがでてきます.これらの制約によってロボットが可能なこと(認識や動作など)が決められます.ここで,技術の進歩により,空も飛べる,海も潜れる,といったロボットがうまれてくるかもしれません.また,陸を100m5秒で走れる人型ロボットもうまれてくるかもしれません.しかし,物理的条件を超えて,瞬間移動ができる(光速以上で移動できる)ロボットなどは不可能です.同じように,光を感知できる,触覚センサを搭載している,匂いセンサによってモノを嗅ぐことができるロボットがでてくるかもしれない. しかし,どんなに多種類のセンサを搭載しても,環境を完全に認識できるロボットは非常に困難でしょう.環境の中で,不完全な「認識」と「行動」の能力しか持ち得ません.

更に身体的制約の一つにもなりますが,脳に相当するコンピュータ部分にも制約があります.それは「認識」したり「行動」を制御したりする処理能力の時間的制約です.どのように技術が進化したとしても,有限時間内に処理が要求され,かつ処理を行うために一定の時間を必要とすることは変わりません.そして最もよい結果を生むためには,まだ来ていない時間・未来の情報が必要になることも多々ありますが,ロボットには未来の情報を認識することは不可能です.

このように実環境下でロボットが有効に存在し続けようとすると,ロボットは能力的に不完全である状態で複雑な環境に対応していかなくてはなりません.これは正に生物が行っていることです.生物も不完全な能力の中で,行き続けるための有効な能力・工夫を身につけています.我々は,「知能」とはそのような能力・工夫のある見方ではないか,と考えています.そして,複雑な環境下で動き続けられるロボットの研究を通して,「知能」というものを考えいきたいと思っています.

ロボットと実環境.png

本研究室の考える知能:生きるための適応能力・動きの創発

人間のレベルで考えると,「知能」とは言葉を操り,道具を操り,情報を操ることのように感じるかもしれません.しかし,生物のレベルで考えると,そこで共通する目標は,自然界の中で生きつづける事であり,そのために様々な工夫を行っています.その工夫を生物の「知能」と考えると,実環境の中で動き続けるという命題は,実はロボットでも生物でも同じです.ロボットの場合,生物と同じような工夫をしなくても,動き続けるという命題はクリアできます.解決方法は様々あります.その中で,生物の工夫を見習い,実現していくことで,生物の「知能」とは何か?そして機械における「知能」とは何か?について考えていくのが我々の知能研究です.

生物とロボットの知能の交差点.png

研究の方向性

我々の研究の方向性としては,複雑な環境下において十分に適応し活動し続けるロボットの実現を目指しています.そして,その中でロボットの動き・振る舞いを通して「知能」とは何かを考えていきます.

これらをふまえて具体的な研究の方向としては,

  • 人により環境に応じて動くシステムの構築
  • 様々な手法を用いて環境に適応するシステムの構築
  • 環境に適応するための新しい概念・手法などの提案

があります.

研究の方向性.png

私たちの興味

注目したいのは,「知能」そのものをつくるのではなく,「知能」の種と「知能」を発現していく過程をデザインしたい,ということです.

我々は,「知能」は出来上がったものであると考えます. それは田中さんや佐藤さんや犬のポチや名もなき昆虫など,「個体」が持っているものです. その「知能」は「個体」が生まれてから得た経験をもとに形作られ,その「個体」特有のものとして存在します. 我々は,各「ロボット」のための「知能」をデザインするよりも,何があれば経験をもとに「知能」を発現させることができるのか,経験を活用するどのようなプロセスが「知能」を形作ることができるのか,そこに興味を持っています.

seed_of_intelligence.png

振る舞いを通した知能の場合,出来上がった「知能」とは周りに合わせて動ける状態となります.暑くて死にそうなとき,日陰に行くのか,風通しの良い場所に行くのか,さらには舌を出して放熱するのか(犬など)など,選択肢はいくつかあります.その時,風がなければ日陰に行くかもしれないし,日陰がなければ風通しの良い場所に行くかもしれないし,暑さの度合いとエネルギー消費を考えて舌を出しておけば十分と考えるかもしれません.これまでの経験と今いる状況に合わせて適切な行動がとれる,という状態が「知能がある」という状態と考えられます.

その時,知能の種と発言していく過程は,「学習できる能力」と「試行錯誤して経験をためて学習していく過程」と考えられます. そこで「機械による学習手法」をベースとして周りの状況に適応し活動し続けることのできるロボットが「結果的にできる」知能の種と過程を模索していくことが私たちの興味となります.

requirements_for_seeds.png

現在,主流として研究が行われているのは「学習によって周囲の状況に合わせて行動を行うアルゴリズム」の提案です.このような研究では,「学習するための指針(何が良い行動で何が良くない行動か)」を人間が設計します.その際に設計者は「ロボットがどのような環境で使われるのか」や「どんな仕事が与えられるのか」を考えながら指針を設計します.例えば「北海道の広い平地で春に農作業をおこなうロボット」を考えると,気温が10〜20℃前後で起伏のない畑の上を移動しながら農作業(種まきや草刈り,土おこしなど)を行うことが求められます.起伏のない畑の上での移動に対して最小エネルギーで農作業を行う行動を良い行動となります.一方で「福岡の広い平地で春に農作業をおこなうロボット」を考えると,同じ行動ながら気温が25〜35℃前後となります.周囲温度が替わるとロボットの内部温度も変わり,福岡では「最小エネルギーを考慮しつつ内部温度が上がりすぎないように農作業を行う行動が良い行動」となるかもしれません.このように環境によって考慮しなくてよかった要因が変わってしまう可能性があります.当然,ロボットの求められる行動が変わると行動の良し悪しも変わります.

一方で,知能の種では「ロボットに埋め込んで,それぞれの場所でそれぞれの仕事をしてほしい」と考えます.その場合,知能の種を設計する人間はロボットが使われる環境やロボットに与えられる仕事などを事前に知ることが出来ません.そこで知能の種は,具体的な環境や与えられる仕事と無関係に,環境への適応方法として設計する必要があると考えます. そこで,

  • 環境や仕事と非依存に
    • 価値観(ものごとの良し悪し)を設計
      • 汎用的な価値観の設計
    • 価値観をもとに自らが必要な仕事を発見
      • タスク発見
    • 必要な仕事が増えても仕事の優劣を判断しつつ行動を決定
      • マルチタスク下での意思決定
    • 頭の中で様々な機能を分化し並列処理を行うことによる迅速な対応
      • 単体ロボット内でのマルチエージェントシステム

を実現したいと考えています.

当研究室が対象としている研究領域や研究テーマなど

研究テーマ概要

  • 汎用的な価値観の設計
    • 二階堂芳:外界とのインタラクションによる強化学習の報酬の自己生成
    • 石塚 昌也:複数センサを用いた報酬の自己生成-危険回避を重視したセンサの重要度の決定-
    • 栗木康汰:マルチモーダルインタラクションを用いた報酬の自己生成-重み付けによるセンサ評価の統合と教示への適用-
    • 伊藤翠那:音入力に対する強さと予測性を用いた報酬の自己生成
    • 福澤航大:複数センサにおけるエージェントと人の相互学習の実現 -学習への寄与度に基づく効果的な入力センサの提示-
  • マルチタスク下での意思決定
    • 下口侑也:人-ロボット間の相互作用による達成依頼度の決定-相対評価を用いた個人差への適応
    • 大沢航洋:複数タスク下における優先度を用いたロボットの行動選択-中間行動による行動の細分化と連続化-
    • 白倉聖也:Adaptation to multi tasks by reflecting person hope degree for importance
    • 田中研也:複数タスク下におけるロボットの行動学習-深層強化学習による連続状態への適応-
    • 前田颯人:複数タスク下におけるロボットの行動選択-優先度に関するパラメータの動的更新による行動停止の回避-
  • 単体ロボット内でのマルチエージェントシステム
    • 高田陽:反復合議型MARLを用いた単体ロボットの行動学習 -非同期的な意思決定による対故障性の実現-
    • 櫻庭康平:複数エージェントの融合・分離による単体ロボットの行動学習 -エージェントの組み合わせ最適化による学習効率の向上-
    • 井上昂浩:ヘテロエージェント群による単体ロボットにおける行動学習-好奇心・学習・制御エージェント間の協調による耐故障性の向上-
    • 松嶋龍文:単体ロボットにおけるHMARLを用いた行動学習-TD誤差に応じた興味度の更新による学習性能の向上-
  • 応用事例
    • 今田大聖:カウンセリングロボットによる頷きの傾聴効果の検証-発話量を基とした定量的評価の提案-
    • 高橋茉莉奈:カウンセリングロボットにおける言語の評価極性を考慮した定量的評価の提案
    • 阿部廉人:カウンセリングロボットにおける頷き回数のランダム化による傾聴効果の改善

これまでの研究

  • 2018年度
    • 石塚 昌也:複数センサを用いた報酬の自己生成-危険回避を重視したセンサの重要度の決定-
    • 櫻庭康平:複数エージェントの融合・分離による単体ロボットの行動学習 -エージェントの組み合わせ最適化による学習効率の向上-
    • 白倉聖也:環境変化に起因する報酬構造の変化への適応〜ロボットの学習空間の生成・選択による再学習の回避〜
    • 井上昂浩:ヘテロエージェント群による単体ロボットにおける行動学習-好奇心・学習・制御エージェント間の協調による耐故障性の向上-
    • 大沢航洋:複数タスク下における優先度を用いたロボットの行動選択-中間行動による行動の細分化と連続化-
    • 下口侑也:Decision Making on Robot using Motivation-Desire Model -Improvement of Learning efficiency by Autonomous-
    • 阿部廉人:カウンセリングロボットにおける頷き回数のランダム化による傾聴効果の改善
    • 栗木康汰:マルチモーダルインタラクションを用いた報酬の自己生成-重み付けによるセンサ評価の統合と教示への適用-
    • 高橋茉莉奈:カウンセリングロボットにおける言語の評価極性を考慮した定量的評価の提案
    • 田中研也:複数タスク下におけるロボットの行動学習-深層強化学習による連続状態への適応-
    • 福澤航大:複数センサにおけるエージェントと人の相互学習の実現 -学習への寄与度に基づく効果的な入力センサの提示-
    • 前田颯人:複数タスク下におけるロボットの行動選択-優先度に関するパラメータの動的更新による行動停止の回避-
    • 松嶋龍文:単体ロボットにおけるHMARLを用いた行動学習-TD誤差に応じた興味度の更新による学習性能の向上-

研究プラットフォーム

研究のプラットフォームとなるツール達

Your borwser is not supporting object tag. Please use one of the latest browsers.
Go to https://onedrive.live.com/embed?cid=6333A57BC13FB404&resid=6333A57BC13FB404%213846&authkey=ADpJmqEdA6AVV5k&em=2

ROS:Robot Operating System

三年生ゼミナールのテーマ

ROSプラットフォームの勉強

プロジェクトについて

3年生を対象に,研究のお手伝いに興味のある人を募集してます.主に共同研究に関する事柄です.興味を持ってくれた学生がいれば倉重まで連絡してください.個々の対応となりますが,内容を伝え,その上でやってみるか聞きますので.

  • 期間
    • 2020年2月くらいまで
      • 現在募集中!
      • 希望者はR301まで
  • 内容
    • 詳しい研究内容は来てくれた学生個々人に伝えます
    • (研究内容に関わらず)やることは,先輩と相談しながらプログラム開発・システム開発などなど
  • 人数
    • 0〜2人くらいまで

当研究室の紹介

メンバー

研究室のメンバー

2019年度

指導員

M2

M1

B4

その他

研究室所在地

所在地

ギャラリー