iRobotLab
認知ロボティクス研究室
>
研究
>
ResearchActivity
>
2013年度
>
02
Top
contents
研究室の紹介
研究室のメンバー
所在地
研究のお話
概要
テーマ
各研究の話
研究業績
その他
ゼミのお話
3年生基盤情報学演習
3年ゼミII
Gitゼミ
情報庫
うちのロボット
学会・イベント
未整理学会一覧
ギャラリー
種々雑多
コンピュータ系
その他
リンク
研究室限定
研究室内GitLab
研究室内moodle
研究室内Nextcloud
PC情報
基本設定
共有PC一覧
生活分担
その他資料
けーじばん
...
最新の10件
2024-05-23
MenuBar
2024-05-15
研究/各研究の話/2023年度
研究/各研究の話
2024-04-01
研究室のメンバー
研究室のメンバー/修士
研究室のメンバー/学士
研究室のメンバー/19期生/山田広来
研究室のメンバー/19期生/村田啓徳
研究室のメンバー/19期生/細川優斗
研究室のメンバー/19期生/中野良祐
なにがしかの数値:
α:1191
β:1
γ:0
研究/各研究の話/2013年度
強化学習における探査率の動的制御
†
強化学習における探査-利用のトレードオフに注目
強化学習では行動選択法のパラメータによって探査-利用のバランスを制御
本研究では特にε-greedy法の探査率εについて扱う
本研究ではロボットが自律的に環境に合わせて探査率εを調整することを目的とする
探査率εを環境遷移に関する情報量を用いて制御する方法を提案
添付ファイル:
ra.png
649件
[
詳細
]
Last-modified: 2023-03-29 (水) 10:47:55
Link:
研究/各研究の話/2013年度
研究/その他/PPL/20150507-01
研究/その他/PPL/20150420-01
研究/その他/PPL/20140401-01