研究/各研究の話

センサ情報の自律的選択による効率的な行動選択の実現

概要

  • 学習を適用したロボットが自身に搭載されている全てのセンサの情報を入力すると, 一般に,学習に要するコスト―時間,メモリなど―が増大する傾向がある
  • 強化学習の枠組みで,センサ情報を自律的に選択し,効率的に行動選択する方法を提案
    • センサ情報の自律的な選択方法:

      センサ情報とタスクの進捗度(即時報酬)の相関分析によって得られる相関係数の閾値判定で実現

    • センサ情報の選択的な利用方法:

      強化学習における行動価値の評価回数を重みとする加重平均で実現

  • 提案する学習機構の有効性を実環境における実機実験によって検証
    • 正方形状に配置した壁によって環境を構成
    • 前方に存在する壁の近傍へ到達することを目的とするタスクを実行
    • 前方に存在する壁との距離を計測する赤外線センサが必要となるように報酬を設定

イメージ

Research Activities T.Numata.png