研究/その他/PPL/20190508-01

2019-05-16 (木) 19:10:57 (180d)

注目したいのは,「知能」そのものをつくるのではなく,「知能」の種と「知能」を発現していく過程をデザインしたい,ということです.

我々は,「知能」は出来上がったものであると考えます. それは田中さんや佐藤さんや犬のポチや名もなき昆虫など,「個体」が持っているものです. その「知能」は「個体」が生まれてから得た経験をもとに形作られ,その「個体」特有のものとして存在します. 我々は,各「ロボット」のための「知能」をデザインするよりも,何があれば経験をもとに「知能」を発現させることができるのか,経験を活用するどのようなプロセスが「知能」を形作ることができるのか,そこに興味を持っています.

seed_of_intelligence.png

振る舞いを通した知能の場合,出来上がった「知能」とは周りに合わせて動ける状態となります.暑くて死にそうなとき,日陰に行くのか,風通しの良い場所に行くのか,さらには舌を出して放熱するのか(犬など)など,選択肢はいくつかあります.その時,風がなければ日陰に行くかもしれないし,日陰がなければ風通しの良い場所に行くかもしれないし,暑さの度合いとエネルギー消費を考えて舌を出しておけば十分と考えるかもしれません.これまでの経験と今いる状況に合わせて適切な行動がとれる,という状態が「知能がある」という状態と考えられます.

その時,知能の種と発言していく過程は,「学習できる能力」と「試行錯誤して経験をためて学習していく過程」と考えられます. そこで「機械による学習手法」をベースとして周りの状況に適応し活動し続けることのできるロボットが「結果的にできる」知能の種と過程を模索していくことが私たちの興味となります.

requirements_for_seeds.png

現在,主流として研究が行われているのは「学習によって周囲の状況に合わせて行動を行うアルゴリズム」の提案です.このような研究では,「学習するための指針(何が良い行動で何が良くない行動か)」を人間が設計します.その際に設計者は「ロボットがどのような環境で使われるのか」や「どんな仕事が与えられるのか」を考えながら指針を設計します.例えば「北海道の広い平地で春に農作業をおこなうロボット」を考えると,気温が10〜20℃前後で起伏のない畑の上を移動しながら農作業(種まきや草刈り,土おこしなど)を行うことが求められます.起伏のない畑の上での移動に対して最小エネルギーで農作業を行う行動を良い行動となります.一方で「福岡の広い平地で春に農作業をおこなうロボット」を考えると,同じ行動ながら気温が25〜35℃前後となります.周囲温度が替わるとロボットの内部温度も変わり,福岡では「最小エネルギーを考慮しつつ内部温度が上がりすぎないように農作業を行う行動が良い行動」となるかもしれません.このように環境によって考慮しなくてよかった要因が変わってしまう可能性があります.当然,ロボットの求められる行動が変わると行動の良し悪しも変わります.

一方で,知能の種では「ロボットに埋め込んで,それぞれの場所でそれぞれの仕事をしてほしい」と考えます.その場合,知能の種を設計する人間はロボットが使われる環境やロボットに与えられる仕事などを事前に知ることが出来ません.そこで知能の種は,具体的な環境や与えられる仕事と無関係に,環境への適応方法として設計する必要があると考えます. そこで,

  • 環境や仕事と非依存に
    • 価値観(ものごとの良し悪し)を設計
      • 汎用的な価値観の設計
    • 価値観をもとに自らが必要な仕事を発見
      • タスク発見
    • 必要な仕事が増えても仕事の優劣を判断しつつ行動を決定
      • マルチタスク下での意思決定
    • 頭の中で様々な機能を分化し並列処理を行うことによる迅速な対応
      • 単体ロボット内でのマルチエージェントシステム

を実現したいと考えています.