iRobotLab
認知ロボティクス研究室
>
研究
>
ResearchActivity
>
2011-006
Top
contents
研究室の紹介
研究室のメンバー
所在地
研究のお話
概要
テーマ
各研究の話
研究業績
その他
ゼミのお話
3年生基盤情報学演習
3年ゼミII
Gitゼミ
情報庫
うちのロボット
学会・イベント
未整理学会一覧
ギャラリー
種々雑多
コンピュータ系
その他
リンク
研究室限定
研究室内GitLab
研究室内moodle
研究室内Nextcloud
PC情報
基本設定
共有PC一覧
生活分担
その他資料
けーじばん
...
最新の10件
2024-05-23
MenuBar
2024-05-15
研究/各研究の話/2023年度
研究/各研究の話
2024-04-01
研究室のメンバー
研究室のメンバー/修士
研究室のメンバー/学士
研究室のメンバー/19期生/山田広来
研究室のメンバー/19期生/村田啓徳
研究室のメンバー/19期生/細川優斗
研究室のメンバー/19期生/中野良祐
なにがしかの数値:
α:1744
β:1
γ:2
研究/各研究の話
強化学習における情報量を用いた探索と利用の自律的制御
†
強化学習における探索と利用のトレードオフに注目
探索と利用のバランスはロボットのメタパラメータで調整するが,このパラメータは人間が一意に設定することが多い.
本研究ではロボットが自律的に環境に合わせてパラメータを調整することを提案
提案手法ではロボットの経験から情報量を算出し,算出した情報量を用いてパラメータを決定する
現在,迷路問題にて有用性を検証中
添付ファイル:
ra.png
823件
[
詳細
]
Last-modified: 2023-03-29 (水) 10:47:55
Link:
研究/各研究の話
研究/各研究の話/2011以前
研究/その他/PPL/20121210-01