|| 英語(English)
学習支援計画書(シラバス) 検索システム
数理・DS・AI教育課程 
授業科目区分 科目名 単位数 科目コード 開講時期 履修方法
数理・DS・AI教育課程
数理基礎科目
数理基礎
データサイエンス基礎Ⅱ
Data Science for Beginners 2
1 G242-01 2024年度
3期(前学期)
修学規程第4条を参照
担当教員名
*印は、実務経験のある教員を示しています。
授業科目の学習・教育目標
キーワード 学習・教育目標
1.機械学習 2.クラスター分析 3.決定木 4.ニューラルネットワーク 5. MATLAB,MS Excel 超スマート社会Society 5.0を実現するためにはデータの活用が不可欠であり,データサイ エンスの素養を身に着けることは今後の必須となる.本講義では,データサイエンスに関連 して広く用いられている1)クラスター分析 2)決定木分析 3)(人工)ニューラルネッ トワークの三つの手法を講義と演習を通じて身に着けることを目指す.講義と演習を通じて ,データを用いた分類や予測を理解して実践できるようになることが目標である.
授業の概要および学習上の助言
本授業では,データサイエンスの重要な利用法である「分類(識別)」と「予測」について講義と演習を通じて学ぶ. まず,機械学習とは何かを理解して,代表的な手法である「クラスター分析」「決定木分析」「(人工)ニューラルネットワ ーク」の三つの手法について,理論と活用方法を学ぶ.「クラスター分析」は似たものどうしをまとめるグループ分けを行う 手法であり,教師データなし機械学習の代表的な手法である.「決定木」は,分類のための木(ツリー)構造を自動的に作成 する手法であり,教師データあり機械学習の有力な手法である.「(人工)ニューラルネットワーク」は,脳神経系を模擬し た教師データあり機械学習の有力な手法であり,近年のAI(人工知能)の代表的な手法であるディープラーニングの基礎とな っている.  いずれの回も,座学による講義だけでなく,実際に手を動かして分析を行う演習を実施する.その演習を実施できるように ,毎回各自のパソコンを持参することが必須である.なお,本授業で用いるデータ分析のツールは,Mathworks社のMATLAB&S imulinkを使用する. 各手法の数理的背景の数式的説明は手法の理解するための最小限にとどめて,実践的な演習を行い,ツールの具体的な操作方 法や分析結果から得ることが期待できる知見のなどの説明に時間を割くように心がける.不明な点は授業時間中に解決すると とともに,復習には時間を割いて欲しい.
教科書および参考書・リザーブドブック
教科書:指定なし 参考書:指定なし リザーブドブック:指定なし
履修に必要な予備知識や技能
先行科目である「データサイエンス基礎Ⅰ」を履修しておくことを必須とする.さらには,統計学の基本を学ぶための「技術 者のための統計」をあわせて履修することを強く推奨する.なお,毎回の授業で分析ツールを使用するので,ラップトップPC を持参する.
学生が達成すべき行動目標
No. 学科教育目標
(記号表記)
D,H 機械学習の意味を理解できたうえで,クラスター分析の目的が説明でき,クラスター分析を実際に行うことができる.
D,H 決定木分析の目的が説明でき,決定木分析を実際に行うことができる.
D,H ニューラルネットワークの目的が説明でき,ニューラルネットワークを実際に使用することができる.
D,H 与えられた多変量データに対して,適切な分析手法を用いた分類や予測ができる.
D,H 各自の専門分野におけるデータサイエンスの意義について基本的な説明ができる.
A 毎回の授業に出席し、与えられた課題に取り組み、授業内容の理解に努めることができる.
達成度評価
評価方法
試験 クイズ
小テスト
レポート 成果発表
(口頭・実技)
作品 ポートフォリオ その他 合計
総合評価割合 0 0 70 0 0 0 30 100
指標と評価割合 総合評価割合 0 0 70 0 0 0 30 100
総合力指標 知識を取り込む力 0 0 30 0 0 0 20 50
思考・推論・創造する力 0 0 20 0 0 0 0 20
コラボレーションと
リーダーシップ
0 0 0 0 0 0 0 0
発表・表現・伝達する力 0 0 10 0 0 0 0 10
学習に取組む姿勢・意欲 0 0 10 0 0 0 10 20
※総合力指標で示す数値内訳、授業運営上のおおよその目安を示したものです。
評価の要点
評価方法 行動目標 評価の実施方法と注意点
試験
クイズ
小テスト
レポート 各回の演習問題および復習のための練習問題を,レポート作成して提出する。 レポートは総合評価割合を70%として評価する。レポートは文章やデータの数値,文章等を丁寧に書き 、課題に取り組んでいく過程を論理的に記述すること。他人のレポートを写すことは厳に慎むこと。また 、レポートの提出期日を厳守すること。レポートの提出期日は授業明細表に記載してある。
成果発表
(口頭・実技)
作品
ポートフォリオ
その他 学習に取り組む姿勢・意欲を,受講態度や授業内容の理解度を,実際のデータ分析ツールの操作に取り組 む状況で評価し, さらに予習・復習として取り組んだ宿題や演習も含めて,総合評価割合30%として評価する。
具体的な達成の目安
理想的な達成レベルの目安 標準的な達成レベルの目安
「クラスター分析」「決定木分析」「(人工)ニューラルネッ トワーク」の3手法を適切に説明するとともに,所与の数値デ ータやカテゴリーデータを含む多変量データに対して,分析ツ ールを用いて適切に分析モデルを作成することができる.この 分析結果を用いて,目的データが未知の場合には,分類や予測 を行い,説明することができる. 各自の専門分野におけるデータサイエンスの役割を説明して, 適切な解析手法を適用して要因分析や知識発見などを行うこと ができる. 与えられた数値データやカテゴリーデータを含む多変量データ に対して,「クラスター分析」「決定木分析」「(人工)ニュ ーラルネットワーク」の3手法を,分析ツールを用いて実施で きる.さらに,この分析結果を用いて,目的データが未知の場 合には,分類や予測を行うことができる. 各自の専門分野におけるデータサイエンスの役割を理解できる .
CLIP学習プロセスについて
一般に、授業あるいは課外での学習では:「知識などを取り込む」→「知識などをいろいろな角度から、場合によってはチーム活動として、考え、推論し、創造する」→「修得した内容を表現、発表、伝達する」→「総合的に評価を受ける、GoodWork!」:のようなプロセス(一部あるいは全体)を繰り返し行いながら、応用力のある知識やスキルを身につけていくことが重要です。このような学習プロセスを大事に行動してください。
※学習課題の時間欄には、指定された学習課題に要する標準的な時間を記載してあります。日々の自学自習時間全体としては、各授業に応じた時間(例えば2単位科目の場合、予習2時間・復習2時間/週)を取るよう努めてください。詳しくは教員の指導に従って下さい。
授業明細
回数 学習内容 授業の運営方法 学習課題 予習・復習 時間:分※
1回 ガイダンス:データサイエンスの利用と意義 データサイエンスに関係する法令と倫理 ・機械学習 ・教師あり学習・教師なし学習(・強化学習) ・予測と分類 ・分析ツールのセットアップ 講義 分析ツールを用いる演習 学習した内容を復習し、課題に取 り組む。 次回の学習内容について配布プリ ントを中心に予習をする。 60分 30分
2回 クラスター分析(1) ・教師なし学習 ・距離と類似度 ・階層クラスタリング(例題:アイリスデータなど) ・デンドログラム(樹形図)など ・演習 講義 分析ツールを用いる演習 学習した内容を復習し、課題に取 り組む。 次回の学習内容について配布プリ ントを中心に予習をする。 60分 30分
3回 クラスター分析(2) ・K-Means(K-平均)法(例題:アイリスデータなど ) ・最適クラスター数の決定:Gap統計量とエルボー法 など ・演習 講義 分析ツールを用いる演習 学習した内容を復習し、課題に取 り組む。 次回の学習内容について配布プリ ントを中心に予習をする。 60分 30分
4回 決定木分析(1) ・情報利得と乱雑さ(不純度) ・分岐(と剪定) ・CART(例題:一例としては,客船タイタニック号の 乗客員の生死などが考えられる.状況により他の具体 例も用いる) ・演習 講義 分析ツールを用いる演習 学習した内容を復習し、課題に取 り組む。 次回の学習内容について配布プリ ントを中心に予習をする。 60分 30分
5回 決定木分析(2) ・C5.0 ・分類木と回帰木 ・ランダム・フォレスト法(⇒アンサンブル学習) ・検証(バリディエーション)と汎化能力など ・演習 講義 分析ツールを用いる演習 学習した内容を復習し、課題に取 り組む。 次回の学習内容について配布プリ ントを中心に予習をする。 60分 30分
6回 ニューラルネットワーク ・神経系 ・パーセプトロン ・誤差逆伝播法など ・演習 講義 分析ツールを用いる演習 学習した内容を復習し、課題に取 り組む。 次回の学習内容について配布プリ ントを中心に予習をする。 60分 30分
7回 総合演習 ・振り返り:データサイエンスとは(再び) ・総合演習のデータに関しては,各学科等で準備,あ るいはオープンデータの利用 また,これまでの授業について振り返りを行う。 講義 分析ツールを用いる演習 特に,全体について振り返り ,復習する。 これまで学習した内容を振り返り ,全体の流れを確認し,復習する 。 60分