平成26年度 情報工学演習B(夜間主)

担当者

  • 担当:倉重(V407),松本,三林
  • 担当TA:小橋(V407)

演習について

  • 演習の場所
    • R106
  • 演習の進め方
    • 詳しくはガイダンス資料を見てください.
    • 演習ですので欠席はしないでください.毎回出欠を取ります.もし,欠席せざるを得ない場合,その理由と関係書類を提出してください.
  • 質問等
    • 演習やレポート課題の内容,プログラミング方法についての疑問は,倉重まで質問に来て下さい.

レポートについて

レポート作成方法

  • レポートの書き方の説明および雛形として次のtexファイルを用いること.
  • 上記texファイルをダウンロードし,解凍する.
    • tar xvf report_sample.tar
  • 解凍してできたファイルを用いて以下のコマンドでpdfファイルを作成する.作成したpdfファイルを開くことで,レポートの書き方等を書いた資料を読むことができる.
    • platex sample.tex
    • platex sample.tex
      • 二回行うこと
      • エラーなく,sample.dviが作成されていることを確認
    • dvipdfmx sample.dvi
    • evince sample.pdf
  • レポートの作成は,上記ファイルを改変し,作成すること.このとき,同じようにpdfファイルを作成し,期日までに提出すること.

レポート作成時のデータとり

レポート作成上の注意

最終レポート提出期限

  • レポートの最終締切
    • 日時
      • 2014年8月5日(火) 18:30まで受付
    • 提出先
      • R棟一階レポートボックス

出欠席表等

演習スケジュール

  • 開講
    • 火 3,4限(18:40-20:10)
    • 水 1,2限(17:00-18:30)
回数演習日内容資料演習課題
16/11(水)ガイダンス 3.1:コマンド・入力・結果・考察を記述すること
6/17(火)1のレポート提出期限
26/17(火)基礎文法 4.4:作成したプログラム・実行コマンド・入力・結果・考察を記述すること
36/18(水)条件分岐 2.6.2:作成したプログラム・実行コマンド・入力・結果・考察を記述すること
6/24(火)2,3のレポート提出期限
46/24(火)反復 2.6.2:作成したプログラム・実行コマンド・入力・結果・考察を記述すること.試行回数は10回で.
56/25(水)配列 2.6.1:作成したプログラム・実行コマンド・入力・結果・考察を記述すること
7/1(火)4,5のレポート提出期限
67/1(火)ポインタ 3.5:作成したプログラム・実行コマンド・入力・結果・考察を記述すること
77/2(水)関数 4.5.2:作成したプログラム・実行コマンド・入力・結果・考察を記述すること
7/8(火)6,7のレポート提出期限
87/8(火)構造体 2.6.1:作成したプログラム・実行コマンド・入力・結果・考察を記述すること.
97/9(水)文字列処理 2.4:作成したプログラム・実行コマンド・入力・結果・考察を記述すること
7/15(水)8,9のレポート提出期限
総合課題の目的:バンディットを解く(高い報酬を得られる)プログラムの作成
総合課題1の目的:個々のバンディットを解くプログラムの作成
10-前半7/15(火)総合演習1 2.2:他人が聞いて理解できるように手順を言葉にする.3.4:作成したプログラム・実行コマンド・入力・結果・考察を記述すること
10-後半7/16(水)総合演習1演習対象のbanditはbandit00と他3つ好きなものを選ぶこと.レポートはbandit00以外で1つ好きなものを選んで,上記課題を行うこと.「2.2 bandit00.oを解く」となっているがbandit00.o以外を選ぶこと
7/22(火)10のレポート提出期限
総合課題2の目的:雛形(スコア計算部分)と自作プログラムを分けて分割コンパイル
11-前半7/22(火)総合演習2 2.6:どのように考えてplayer.cを作ったかの説明・作成したプログラム・実行コマンド・入力・結果・考察を記述すること
11-後半7/23(水)総合演習2演習対象のbanditはbandit00と他3つ好きなものを選ぶこと.レポートはbandit00以外で1つ好きなものを選んで,上記課題を行うこと.
7/29(火)11のレポート提出期限
総合課題1の目的:ひとつのプログラムで全てのバンディットを解くプログラムの作成
12-前半7/29(火)総合演習3教員に指示を仰ぐ(公式スコア登録・汎用player・all bandit...)
12-後半7/30(水)総合演習3演習課題:作成したplayer.cのソースコード、どのように考えて作ったかの説明、実行結果(wikiに出ているスコア)、考察
8/5(火)12のレポート提出期限
  • 注意
    • どのバンディットをプレイしているか分かるように,コンパイル時のコマンドもレポートに記述しておくこと
      • 例:gcc -o game player.c bandit03.o であるなら,バンディット03を実行してることがわかる

N本腕バンディット

N本腕バンディットとは

本演習で用意するN本腕バンディットの一覧

識別番号ファイル難しさ内容テストプレイ
.hfilebandit.h---ヘッダファイルfileplayer.c
00filebandit00.o腕の数3本のバンディットfilegameplay00
01filebandit01.o☆☆腕の数7本のバンディットfilegameplay01
02filebandit02.o☆☆☆腕の数7本のバンディットfilegameplay02
03filebandit03.o☆☆☆腕の数7本のバンディットfilegameplay03
04filebandit04.o☆☆☆☆腕の数7本のバンディットfilegameplay04
05filebandit05.o☆☆☆☆☆腕の数3本のバンディットfilegameplay05
06filebandit06.o☆☆☆☆☆腕の数3本のバンディットfilegameplay06
07filebandit07.o☆☆☆☆腕の数3本のバンディットfilegameplay07
08filebandit08.o☆☆☆☆☆腕の数5本のバンディットfilegameplay08
  • 注意
    • テストプレイは,該当ファイルをダウンロード後に「chmod +x ファイル名」が必要
      • 例: chmod +x gameplay00

N本腕バンディット・オブジェクトファイルの使用方法

N本腕バンディットプレーヤー創作(総合演習)

  • 全ての演習終了まで関係なし.

目的

  • バンディットを自動的にプレイし,解く(高い報酬を得る)プログラムを作成する.

アプローチ

  • 対象のバンディットを決める
    • bandit00とあと二つ程度選択
  • 自分でバンディットをプレイし,高い報酬を得るためにはどのように腕を選択すべきか考える.
  • 考えた選択の方法をプログラムで実装する

作成したプログラムの出来の評価方法

  • 作成したプログラムがどれだけ良いのか,その評価はどれだけ報酬をもらえたかで為される.
  • ここでは,10万回プレイをし,その中で連続した1万回のプレイで得た報酬の合計としている.これを「 スコア」とする.
  • 他の人が作成したプログラムよりも高い「スコア」を得ていれば,他の人が作成したプログラムよりも優れていることを示す.

まずやること・バンディットを解くプログラムの作成

  • このページを参考に,
    • select_arm=
  • の値を決めるプログラムを作成する.

N本腕バンディットを解くプレーヤーを作成したときに,他と比較・競うために

スコア(演習の成績とは関係なし)

学生番号氏名000102030405060708Total Max
TA2011のTAの学生さん9431.006793.0022729.506759.0022758.001125.001079.005838.008852.0084658.00
TA2012のTAの学生さん9443.003197.0019907.005821.0020902.501143.002315.005390.007496.0074647.50
TA2013のTAの学生さん10000.004049.0020282.504016.0020346.001124.002316.005853.007413.0073635.50
100340212012年度学生さん10000.007162.0022986.007153.0022902.001124.002316.005812.009128.0086151.00
110340202013年度学生さん10000.007144.0022968.007170.0022986.001111.002317.0010000.0010000.0093292.00
110340162013年度学生さん10000.007146.0023013.007145.0022935.001124.002318.0010000.0010000.0093260.00
110340082013年度学生さん10000.007118.0022687.507075.0022794.001136.00915.005804.009040.0086252.50
110340192013年度学生さん10000.007121.0021515.007132.0023031.001095.001001.006443.009094.0073546.00
100000010000.005236.0017366.007184.0023058.001139.001132.005826.006121.0076293.00
TA201410000.007088.0022645.007082.0022815.001101.001126.0010000.006095.0083547.00
1203400110000.007168.0021615.007138.0022899.001133.001103.005861.009103.0082913.00
1203400210000.007098.0022920.007143.0022863.001128.001108.005825.009076.0086583.00
1203400310000.007123.0022795.007158.0022893.001128.001114.0010000.009077.0090727.00
1203400410000.007107.0022749.007107.0022728.001083.001113.0010000.0010000.0091743.00
1203400510000.005186.0017262.007136.0022839.001128.001104.005822.006131.0074717.00
120340060000000000
1203400710000.007070.0022660.007135.0022824.001098.001104.005798.009042.0086127.00
1203400810000.007177.0021565.007149.0023040.001132.001094.0010000.0010000.0073620.00
1203400910000.007102.0021532.007173.0022950.001102.001119.0010000.0010000.0090015.50
1203401010000.002649.0020377.507142.0022779.001113.001122.005792.005144.0073318.50
1203401110000.007131.0022581.007111.0022743.001119.001124.0010000.0010000.0091081.00
120340130000000000
1203401410000.005047.0021390.006923.0021450.001091.001093.005804.006055.0078636.00
1203401510000.007175.0022804.507163.0022902.001131.001121.0010000.009098.0090780.50
1203401610000.007198.0022902.007134.0022990.001122.001108.0010000.0010000.0091414.00
1203401710000.007119.0022291.507040.0022490.001120.001124.0010000.0010000.0079537.50
1203401810000.007186.0022719.007085.0022917.001119.001117.0010000.0010000.0091643.50
1203401910000.005124.0022986.007129.0022855.001132.001111.005808.006052.0081653.00
1203402010000.007154.0022992.007168.0022929.001103.001106.0010000.0010000.0091459.00
120340213334.002149.0020583.004978.0021853.001109.001105.0010000.005471.0068918.00
1203402210000.007188.0022878.007130.0022863.001113.001114.0010000.0010000.0092054.00
1203402310000.007148.0023028.007162.0022917.001130.001136.005817.009077.0081623.00
1203402410000.007102.0022809.007124.0022944.001102.001139.0010000.0010000.0091603.00
1203402510000.007014.0021032.007106.0022430.001117.001120.0010000.007248.0078379.00
1203402610000.007148.0022823.007122.0022950.001122.001107.0010000.0010000.0091491.00
1203402710000.007127.0022839.007128.0022887.001116.001121.0010000.009113.0090628.00

日本語が出なくなったときの対応

推奨

  • コンピュータで扱える日本語はいくつかあるが,ターミナルはEucという文字しか表示できない.プログラムの中でEuc以外の日本語を使用すると表示されなかったり読めない文字が出てきたりする.その場合,以下の方法でプログラム中の日本語をEucにする.
    • Emacsで以下のコマンドを打つ
      • ctrl-x (Controlキーを押しながらxを打つ)
      • return
      • f
    • すると以下のメッセージ
      • Coding system for saving file (default nil):
    • が出るので,続いて以下の文字を打ってreturnキーを押す
      • euc-jp
    • プログラムを保存して完了

最終手段

  • ファイルに対して,使用している日本語の種類を強制的にかえる方法.ただし,バックアップをきちんと取っておかないとファイル自体が消えてしまったり使えないものになったりするので推奨はしない&使用する場合は非常に気をつけること
      • sample.tex中の日本語を強制的にEUC-JPに変える
      • コマンドライン(ターミナル)で作業
    • 元となるファイルをバックアップ
      • cp sample.tex sample.tex.bk
    • 日本語の変換
      • nkf --overwrite -e sample.tex
    • emacでsample.texを開いてEUC-JPにかわっていることを確認

乱数の使い方

  • 乱数の使い方
    • banditの中で簡単に使う方法.ちゃんとした使い方は各自調べた方がよい
  • 0.3の確率で何か(ランダム)をして、0.7の確率で何か(ちゃんと)をする、のような使い方
 double r = (double) rand() / (double)RAND_MAX;
 
 if( r <= 0.3){
   なにか(ランダム)
 }else{
   なにか(ちゃんと)
 }
  • rand()は0からRAND_MAX(と定義されている整数)の間のランダムな数を出力する。なので、
    • rand() / RAND_MAX
  • で、0から1の間のランダムな数となる。よって、これが(上記の例だと)0.3より小さい数である、と考えるのは0.3の確率で生じる、というのと同じことである。
  • 0から4の間の選択しをランダムに選ぶ
 int r = rand() % 5;
 
 switch(r){
 case 0:
   break;
 case 1:
 ...
 }
  • rand() % 5 とやると5で割ったあまりの数(0から4)が得られる。ここで、rand()はランダムな整数なので、ランダムな0から4までの値を得ることができる。

教員用メモ

TA用メモ