| 開課地點: | 北京 | |||||||
|---|---|---|---|---|---|---|---|---|
| 授課時間: | 3天 | |||||||
| 授課顧問: | 楊老師 | |||||||
| 開課時間: | 2016-05-18 | |||||||
| 市場報價: | 6875 | |||||||
| 購買價格: | 5500 | |||||||
| 課程排期 |
| |||||||
| 審核時間: | 我要報名2016-03-14 17:25:36 | |||||||
1,系統架構師、系統分析師、高級程序員、資深開發(fā)人員。
2,牽涉到數據挖掘和統計分析的數據中心運行、規(guī)劃、設計負責人。
3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。
4,高校、科研院所牽涉到數據挖掘與統計分析處理的項目負責人。
楊老師
由業(yè)界知名大數據專家親自授課
主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發(fā)工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發(fā)經驗。
第一講數據挖掘和R簡介
1.1 數據挖掘
1.2 R語言
1.3 Iris數據集
1.4Bodyfat數據集
第二講數據的導入與導出
2.1 R數據的保存與加載
2.2 CSV文件的導入與導出
2.3 通過ODBC從數據庫中讀取數據
2.4 從Excel中導入與導出數據
第三講數據可視化展現
3.1 查看數據
3.2 單個變量展現
3.3 多個變量展現
3.4 更多探索
3.5 將圖表保存到文件中
第四講決策樹與隨機森林
4.1 使用party包構建決策樹
4.2 使用rpart包構建決策樹
4.3 隨機森林
第五講回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
第六講聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
第七講離群點檢測
7.1 單變量的離群點檢測
7.2 局部離群點因子檢測
7.3 用聚類方法進行離群點檢測
7.4 時間序列數據的離群點檢測
第八講時間序列分析
8.1 R中的時間序列數據
8.2 時間序列分解
8.3 時間序列預測
8.4 時間序列聚類
8.5 時間序列分類
第九講關聯規(guī)則
9.1 關聯規(guī)則的基本概念
9.2 Titanic數據集
9.3 關聯規(guī)則挖掘
9.4 消除冗余
9.5 解釋規(guī)則
9.6 關聯規(guī)則的可視化
第十講社交網絡分析
10.1 詞項網絡
10.2 推文網絡
10.3 雙模式網絡
第十一講 R與Hadoop/Spark等大數據技術的融合
1)R/Hadoop數據處理技術介紹
2)SparkR數據處理技術介紹
3)基于Hadoop/Yarn集群的應用展望
培訓目標
1,全面了解R語言數據挖掘的相關知識。
2,學習R的數據挖掘核心技術方法以及應用特征。
3,深入使用R在數據挖掘和分析中的使用。
4,了解R與Hadoop、Spark等技術的融合使用。
網站備案號:粵ICP備14053066號-1 版權所有:英盛企管
Copyright 2015 Enterprise Management Training Center All Rights Reserved.