| 1 |
科目ガイダンス
教科書「第1章 序」
教科書「第2章 多腕バンディット問題」
自己点検 |
講義(質疑応答を含む)と演
習
自己点検 |
予習:教科書該当範囲の通読
復習:授業内容の理解 |
100
100 |
| 2 |
教科書「第3章 有限マルコフ決定過程」
教科書「第4章 動的計画法」
自己点検 |
講義(質疑応答を含む)と演
習
自己点検 |
予習:教科書該当範囲の通読
復習:授業内容の理解 |
100
100 |
| 3 |
教科書「第5章 モンテカルロ法」
教科書「第6章 TD学習」
自己点検 |
講義(質疑応答を含む)と演
習
自己点検 |
予習:教科書該当範囲の通読
復習:授業内容の理解 |
100
100 |
| 4 |
教科書「第7章 nステップ・ブートストラップ法」
教科書「第8章 テーブル形式手法におけるプランニ
ングと学習」
自己点検 |
講義(質疑応答を含む)と演
習
自己点検 |
予習:教科書該当範囲の通読
復習:授業内容の理解 |
100
100 |
| 5 |
教科書「第9章 近似を用いた方策オン型予測」
教科書「第10章 関数近似を用いた方策オン型制御
」
自己点検 |
講義(質疑応答を含む)と演
習
自己点検 |
予習:教科書該当範囲の通読
復習:授業内容の理解 |
100
100 |
| 6 |
教科書「第12章 適格度トレース」
教科書「第13章 方策勾配法」
自己点検 |
講義(質疑応答を含む)と演
習
自己点検 |
予習:教科書該当範囲の通読
復習:授業内容の理解 |
100
100 |
| 7 |
総括
自己点検 |
講義(質疑応答を含む)
自己点検 |
予習:第6回までの授業内容の復
習
復習:授業内容の理解 |
100
100 |