トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS   ログイン

強化学習系/N本腕バンディット の変更点

[[lab_limit/作成したprogram]]
**N本腕バンディットとは [#q9fa04d1]
**N本腕バンディットのプログラム [#vc4f56dd]
--RL_bandit
---メインプログラム.
#ref(RL_bandit.c)
---実行ファイル.(このファイル1個でだいたい全部実行されると思う)
#ref(RL_bandit)
--メニュー
---プログラム.
#ref(select.c)
---プログラム.
#ref(select.h)
--バンディットマシン
---プログラム.
#ref(bandit_machine.c)
---ヘッダーファイル.
#ref(bandit_machine.h)
--人間のplay用
---プログラム.
#ref(man_play.c)
---ヘッダーファイル.
#ref(man_play.h)
--ε-greedy法
---プログラム.
#ref(com_eps_g.c)
---ヘッダーファイル.
#ref(com_eps_g.h)
--SOFTMAX法
---プログラム.
#ref(com_softmax.c)
---ヘッダーファイル.
#ref(com_softmax.h)
--追跡手法
---プログラム.
#ref(com_pursuit.c)
---ヘッダーファイル.
#ref(com_pursuit.h)
--強化比較
---プログラム.
#ref(com_reinfo.c)
---ヘッダーファイル.
#ref(com_reinfo.h)

注:プログラムには間違いがある可能性があります.何か発見したら,尾上まで教えて下さい.