KGC


慶應義塾大学湘南藤沢キャンパス
授業概要(シラバス)


インターネット計測とデータ解析 (長 健二朗

    2012年度春学期 金曜日4時限
    科目コード: 90527 / 2単位
    カテゴリ: 26.特設科目(学部)


1. 主題と目標/授業の手法など

    インターネット上でのデータ収集とその解析手法について学習し、ネットワーク技術と大規模データ処理の総合的な知識と理解を得る。
    授業では、具体的な応用例について、その基礎技術と背景にある理論を関連づけて理解する。講義に加えて、毎回データ処理の演習を行い、習った理論をプログラムに実装してデータ処理をすることで、データ解析手法を身につける。


2. 教材・参考文献

    講義資料をオンライン配布

    ruby: http://www.ruby-lang.org/
    gnuplot: http://gnuplot.info/

    [1] Mark Crovella and Balachander Krishnamurthy.
    Internet measurement: infrastructure, traffic, and applications.
    Wiley, 2006.
    [2] Pang-Ning Tan, Michael Steinbach and Vipin Kumar.
    Introduction to Data Mining.
    Addison Wesley, 2006.
    [3] Raj Jain.
    The art of computer systems performance analysis.
    Wiley, 1991.
    [4] Toby Segaran. (當山仁健 鴨澤眞夫 訳)
    集合知プログラミング.
    オライリージャパン. 2008.
    [5] あきみち、空閑洋平.
    インターネットのカタチ.
    オーム社. 2011.
    [6] 井上洋, 野澤昌弘.
    例題で学ぶ統計的方法.
    創成社, 2010.
    [7] 平岡和幸, 掘玄.
    プログラミングのための確率統計.
    オーム社, 2009.


3. 授業計画

    第1回 イントロダクション
    ビッグデータと集合知
    インターネット計測
    大規模データ解析
    演習: ruby入門

    第2回 データとばらつき
    要約統計量 (平均、標準偏差、分布)
    サンプリング
    グラフによる可視化
    演習: gnuplotによるグラフ描画

    第3回 データの収集と記録
    ネットワーク管理ツール
    データフォーマット
    ログ解析手法
    演習: ログデータと正規表現

    第4回 分布と信頼区間
    正規分布
    信頼区間と検定
    分布の生成
    演習: 信頼区間
    課題1

    第5回 多様性と複雑さ
    ロングテール
    Webアクセスとコンテンツ分布
    べき乗則と複雑系
    演習: べき乗則解析

    第6回 相関
    オンラインお勧めシステム
    距離とエントロピー
    相関係数
    演習: 相関

    第7回 多変量解析
    データセンシング
    線形回帰
    主成分分析
    演習: 線形回帰

    第8回 時系列データ
    インターネットと時刻
    ネットワークタイムプロトコル
    トラフィック計測
    時系列解析
    周波数分析
    トレンド解析
    演習: 時系列解析
    課題2

    第9回 トポロジーとグラフ
    経路制御
    グラフ理論
    最短経路探索
    演習: 最短経路探索

    第10回 異常検出と機械学習
    異常検出
    機械学習
    スパム判定とベイズ理論
    演習: 機械学習

    第11回 ゲストトーク
    AS Core: Visualizing the Internet.
    Bradley Huffaker (CAIDA)

    第12回 検索とランキング
    検索システム
    クローリング
    ページランク
    演習: PageRank

    第13回 データマイニング
    パターン抽出
    クラス分類
    クラスタリング
    演習: クラスタリング

    第14回 スケールする計測と解析
    大規模計測
    MapReduce
    分散並列処理
    クラウド技術
    インターネット計測とプライバシー
    演習: 並列処理


4. 提出課題・試験・成績評価の方法など

    2回の課題提出と学期末レポート提出


5. 履修上の注意・その他

    理論的な理解を深めるためには代数や統計の知識が必要となるが、本授業では、工学的応用のためにどのように数学が使われるかを理解することに主眼を置く。
    授業では、データ解析プログラミング演習として、Ruby言語を使ったデータ解析と、gnuplotによるグラフ描画を行うので、ある程度のプログラミング能力が必要となる。


6. 前提科目

    統計の基礎知識と、プログラミング経験。


7. 履修条件

    なし


8. 旧科目との関係

    なし


9. 授業URL


2012-03-12 17:15:04.70907


Powered by SOI Copyright(c) 2002-2019, Keio University Shonan Fujisawa Campus. All rights reserved.
このサイトの著作権について