• コミュニケーション相手を取捨選択する手法を提案した
  • 提案手法は即時報酬環境と遅延報酬環境の2つの環境に対してそれぞれ提案した.
  • 提案手法と通常の強化学習を組み合わせることでコミュニケーション個体の取捨選択を行い効率的な個体学習を実現するシステムを構築した
  • 迷路問題に構築したシステムを適用し,提案手法の有効性を実証した.


ResearchActivity1.png


ResearchActivity2.png

添付ファイル: fileResearchActivity1.png 329件 [詳細] fileResearchActivity2.png 340件 [詳細]