iRobotLab
研究/ResearchActivity/2009-003
2018-04-16 (月) 15:53:00 (1049d)
研究/各研究の話
報酬に依存しない情報を知識化することを提案し,報酬非依存型知識と定義した
強化学習において報酬非依存型知識を利用するシステムを構築した
報酬非依存型知識を強化学習に組み込むことで,学習の効率を上げ,タスク変化に柔軟に対応できるようにした
構築したシステムを迷路問題へ適用し,報酬非依存型知識を利用することが有用であることを示した
Link:
研究/各研究の話
(296d)
研究/各研究の話/2011以前
(1049d)
添付ファイル:
ResearchActivity02.png
577件
[
詳細
]
ResearchActivity01.png
607件
[
詳細
]
検索
サイト内
Web
編集操作
編集
添付
差分
バックアップ
Top
contents
研究室の紹介
研究室のメンバー
所在地
研究のお話
概要
テーマ
各研究の話
研究業績
その他
ゼミのお話
3年研究課題調査
3年ゼミII
Gitゼミ
情報庫
うちのロボット
学会・イベント
未整理学会一覧
ギャラリー
種々雑多
コンピュータ系
その他
リンク
研究室限定
研究室内GitLab
研究室内moodle
PC情報
基本設定
共有PC一覧
生活分担
その他資料
けーじばん
...
最新の10件
2021-01-06
研究/研究業績/国際学会
2020-11-11
研究/研究業績/論文
2020-10-16
研究/研究業績/国内学会
2020-05-08
研究/その他/PPL/20190516-01
研究/その他/Archives/3年生研究課題調査研究紹介用
研究/その他/PPL/20160329-01
研究/各研究の話/2019年度
研究/各研究の話
2020-05-02
研究室のメンバー/修士
研究室のメンバー/学士
なにがしかの数値:
α:1156
β:1
γ:0