シラバス情報

科目名
データマイニング論
授業コード
24053
担当者名
石野 亜耶
副題
大量のデータからビジネスに役立つ情報を抽出する理論と手法を学ぶ
科目ナンバリング
単位数
2単位
配当年次
3年
開講学期
2023年度前期
教職免許種類

授業内容
センサーデータからテキストに至る多様で膨大なビッグデータ(Big Data)の活用を行うデータサイエンティストが注目されています。データサイエンティストが身に着けておかなければならない技術の1つとしてデータマイニングが挙げられます。データマイニングとは、大量のデータから、有益な情報を抽出するための技術です。本講義では、ビッグデータの活用事例や、ビジネスやサービスでデータマイニングがどのように利用されているか学び、基礎的な手法を習得します。
・講義の形式:座学です。
・課題:講義内容を踏まえた練習問題を用意し、授業の冒頭で解説を行います。
到達目標と卒業認定・学位授与の方針との関連
・ ビッグデータの活用事例を学びます。
・ ビジネスやサービスで、データマイニングの技術がどのように利用されているかを学びます。
・ データマイニングの基礎的な手法を学びます。

【身につく力】 「知識・理解」「論理的思考力・分析力」
授業計画
第1回 データマイニングとは
第2回 データの可視化
第3回 データ分析の基礎
第4回 データマイニングのための基礎数学
第5回 よく一緒に購入される商品を明らかにする バスケット解析
第6回 お勧めの商品を推薦する仕組み 情報推薦システム
第7回 意思決定を手助けする 決定木
第8回 データをグループ分けして特徴を分析する クラスタリング
第9回 第1回〜第8回のまとめ
第10回 テキストマイニングとは
第11回 テキストから重要語を抽出する TF-IDF
第12回 単語の繋がりを可視化する 共起ネットワーク
第13回 テキストをカテゴリに分類する 文書分類
第14回 Webマイニングとは
第15回 まとめ
関連科目
本講義は、「データマイニング演習」とペア科目です。「データマイニング演習」と合わせて受講することをお勧めします。
準備学習等の指示
復習用に練習問題を用意します。練習問題にチャレンジして理解を深めてください。練習問題を解くには、30分以上が必要です。
教科書
教科書は使用しません。適宜資料を配布します。
参考文献
石川博・新美礼彦・白石陽・横山昌平 『データマイニングと集合知』 共立出版
金明哲 『マーケティング・データ分析の基礎』 共立出版
酒巻隆治・里洋平 『ビジネス活用事例で学ぶ データサイエンス入門』 SBクリエイティブ
田中克己・角谷和俊 『情報推薦システム入門』 共立出版
金明哲 『テキストデータの統計科学入門』 岩波書店
定期試験の実施
定期試験を実施します。
成績評価の方法
定期試験、演習課題・提出物を総合的に評価します。
・ 定期試験 70%
・ 授業への参加度と演習課題・提出物 30%
定期試験は、「すべて持ち込み可」、「電卓持ち込み可」で実施します。
欠席の多い場合や受講態度が著しく悪い場合については減点します。
出席回数が総授業回数の3分の2に満たない場合には、定期試験の受験を認めません。
実務経験と授業との関連
備考
・ 講義はパワーポイントの資料を使用して進めます。
・ 講義で配布した資料は、HUE NAVIの授業資料に掲示します。
・ 受講中は私語・飲食厳禁です。