KGC


慶應義塾大学湘南藤沢キャンパス
授業概要(シラバス)


データ・ドリブン社会の創発と戦略 (安宅 和人

    2019年度春学期 水曜日2時限
    科目コード: X1038 / 2単位
    カテゴリ: 11.特設科目(学部)


1. 主題と目標/授業の手法など

    ■ 本講義の特徴

    1. 長年、多様なデータを用いたさまざまな分析に関わってきた立場から、実際の仕事や研究に役立つ分析力とは何かを実戦的に伝承する
    2. 情報科学技術以前の本質的なサイエンス、分析、問題解決の考
    え方に極力フォーカスする
    3. 知っているだけではなく分かる、分かるだけでなく出来るに注
    力する、、、アタマだけで知っていることを認めない
    4. 一方通行ではなく、できる限りインタラクティブに実施する
    5. ログデータと市場リサーチデータの両方を扱う
    6. 普通には外に出ることがないヤフーのデータを利活用する
    7. 3年以下の成績優秀者で希望する方にはヤフーでのインターンの場を用意します

    (注)ツール系のスキルを教える講座ではありません。必要ツールがある程度使えることを前提に講義を進めます。どのようなツールを使うかは各自学生に任せます最低限のツールスキル(Excel、SQL)は3限の補講で対応します。必要なひとは自発的な参加。参加しない場合はできると見なします(資料・ビデオは履修者限定で展開しますのでコンフリクトがある場合、そちらを参照)ただ純粋にツールスキルを身に着けたい方は本講座ではなく別の講座を履修して下さい


    ■ 補講について

    ツールを教える講座ではありませんが、対象スキルがない人のために補講を立てています。補講の参加は必須ではありませんが、対象スキルについてビギナーの方には強く推奨します。


    ■ 想定受講者

    - 情報科学オタクというより、本当に世の中で分析、データ利活用で変化を起こしたい方(本講座でハイエンドの機械学習、自然言語処理問題などは扱いません)
    - この世界でデータや分析はどのように世の中に役に立っているのかを理解し、その基本的なスキルを身につけたいと思っている方
    - 課題解決、意思決定と分析の関係について肌で感じ、学びたいと思っている方
    - これまで色々分析に取り組んでみたが、価値を生み出すポイントが良くわからない方
    - ★通常、全体観を持って教えられることの少ない科学的、及び分析的思考のベースになるものをカバーする内容のため、可能な限り1、2年次での履修を強くオススメします


2. 教材・参考文献

    - 「統計でウソをつく法―数式を使わない統計学入門」 (ブルーバックス)
    - 「データサイエンス講義」(オライリー・ジャパン)
    - “Data Science for Business” (O’Reilly)
    - 「イシューからはじめよ」(英治出版)
    - ※ 必ずしも適切な教材が見当たらないため、授業の進捗にそって適宜紹介する。


3. 授業計画

    第1回 時代背景と本講座の位置づけ
    - データドリブンな課題解決領域の広がり
    - ドメイン知識の重要性
    - 3つのデータ
    - データとデータ解析
    - 歴史的な局面
    - 求められる人物
    - Professional とは何か?

    第2回 分析の本質とデータ利活用の広がり
    - 分析の基本
    - 分析の3つの目的
    - 意味合い出しのポイント
    - ダメな分析のパタン
    - データ表現の基本
    - 統計数理の5つの役割
    - データの広がりとデータごとによる特徴

    第3回 データから価値を生み出すとは何か?
    - 調査データとビッグデータのサイクル
    - 聞いたことがある、わかっている、できるの違い
    - データ利活用の 3 要素、、、収集、処理、活用
    - データを使う目的
    - 事業でのデータ利用の3用途
    - マーケティングとは何か
    - マーケティング的な事業の見方と課題

    第4回 調査データ1:データを読む
    - いけてない分析の見極め方
    - データを読むポイント
    - 相関と因果
    - 相関があっても因果関係のない典型的パターン
    - 可視化のプロセス
    - 答えを出す手順

    ★(補講1)Excel1:Excel の基本

    第5回 調査データ 2:データの性質を知る
    - データを眺める(性質を理解する)
    - 比較して意味合いを出す
    - どのぐらい外れると意味のある異常値なのか?
    - 軸選び
    - クラスタリングとセグメンテーション
    - 分析結果から試算する、、、推計のロジック

    ★ (補講2)Excel2:分析の基本
    - 分析ツール
    - 基礎的な統計解析: 和、平均、分散、相関
    - 相関係数 R と決定係数 R2
    - クロス分析(ピボットテーブル)
    - 散布図からカーブフィットする

    第6回 データをチャート化する1
    - チャート化の 2 つの目的
    - チャートの基本構造
    - 15 秒ルール
    - 縦と横の広がり
    - 標準化と重み付け

    ★(補講3)SQL の基礎1

    第7回 データをチャート化する2
    前回の内容に基づく訓練

    (補講4)SQLの基礎2

    第8回 行動ログデータ1
    - リアル空間のデータ化
    - コンテキスト・アウェア・ コンピューティング(Context
    - Aware Computing)
    - スマホに内蔵されているセンサ
    - 行動ログに隠された情報
    - 活動量計データと同行検知

    第9回 行動ログデータ 2
    - データを眺め、仮説をたてる
    - グラフ的な関係を見る
    - 大量の単純処理を回す工夫 (プログラムの役割)
    - センサデータ解析のための前処理
    - データ成型、データ変換、ノイズ除去

    第10回 調査データ3:ニーズを掴む
    - 基本となるマインドセット
    - ニーズとベネフィット
    - ニーズの 4 レイヤ
    - ブランドダイアモンド
    - 本音と建前
    - ブレイクポイント

    第11回 調査データ 4:ニーズを掴む2
    - 消費者マーケティングにおけるリサーチ手法の広がり
    - 軸出しに関する考察
    - MECE に考える技

    第12回 クエリログデータ1: インフル予測
    - クエリデータとはなにか
    - データ分析と可視化の関係
    - データ利用基盤の三層構造
    - 情報利活用に必要なプロフェッショナルの広がり
    - イシュー見極めのポイント
    - モデル化と予測
    - シグナルとノイズ
    - 実数と指数

    第13回 クエリログデータ2: 選挙予測
    - 縦軸と横軸:変数とアウトプット
    - データ類似性の判別
    - ドメイン知識の重要性
    - モデル化と予測2

    第14回 データと AI がもたらす未来
    - 平均は事実を必ずしも表さない
    - AI に関する誤解と正しい理解
    - ビッグデータと AI の関係
    - 機械学習による AI がもたらす変化
    - シゴトの未来
    - 人工知能の不都合な真実
    - AI×データはビジネスをどう変えるか
    - データ・キカイ時代の新しいヒエラルキー


4. 提出課題・試験・成績評価の方法など

    本講座における単位の考え方

    出席、毎週の課題を真面目に提出している限り単位は確実です

    ワーク(宿題+毎回のアンケート)
    提出、、、加点(未提出、、、減点)
    できが良い、面白い、、、更に加点

    講義、チームへの貢献を評価します(以下を加点)
    建設的な質問
    積極的、建設的な発言
    リーダーシップ、フォロワーシップ


5. 履修上の注意・その他

    なし


6. 前提科目

    高校1-2年程度の数学の知識、スキル、Excelで基本的なことができる程度の素養


7. 履修条件

    履修 ★クラスの性質上50~60名を上限の目安とする ★履修希望が増えすぎているため原則1~3年生のみの履修とする


8. 旧科目との関係

    なし


9. 授業URL


2019-01-31 15:27:52.352876


Powered by SOI Copyright(c) 2002-2019, Keio University Shonan Fujisawa Campus. All rights reserved.
このサイトの著作権について