大數據工具應用(微課視頻版高等學校大數據管理與應用專業規劃教材)
內容大鋼
本書是為配合「大數據工具應用」在線開放課程而編寫的新形態大數據入門教材,以講授大數據基礎知識和工具應用為目標,立足應用入門,強調工具操作,突出案例教學,力圖將理論與實踐相結合,講解和演示如何基於所學理論選擇大數據工具去解決實際問題。
全書共7章。內容包括:大數據基本概念及其應用;數據獲取;數據分析入門;數據分析進階;Tableau數據可視化;數據分析拓展;數據思維。
在掌握Word和Excel基本操作的前提下,就可以使用本書學習,學習過程中無須編程。本書可作為推進新工科、新醫科、新農科、新文科建設中普及大數據基礎知識和工具應用的教材,也可以作為各類人士踏人大數據之門和揭開大數據神秘面紗的參考書。
作者介紹
編者:鍾雪靈//郭藝輝|責編:劉向威
鍾雪靈,博士,廣東金融學院互聯網金融與信息工程學院教授,廣東省本科高校電腦類專業教學指導委員會委員。主持和參與多項國家自然科學基金項目和國家社會科學基金項目。在Naval Research Logistics, European Journal of Operational Research, Annals of Operations Research等期刊發表論文數十篇。入選廣東省高等學校優秀青年教師培養計劃項目。主編《Python程序設計基礎》和《演算法基礎與實驗》兩部教材。主持和參與建設的慕課「大數據工具應用」已在「智慧樹」正式上線。
目錄
第1章 大數據基本概念及其應用
1.1 大數據應用概況
1.1.1 大數據的定義
1.1.2 大數據的特點
1.1.3 大數據的結構
1.1.4 相關技術
1.1.5 現狀與趨勢
1.2 大數據處理步驟
1.2.1 數據獲取
1.2.2 數據存儲
1.2.3 數據管理
1.2.4 數據分析
1.3 應用案例
1.3.1 商品推薦服務
1.3.2 公共信息服務
1.3.3 數據呈現服務
第2章 數據獲取
2.1 格式轉換與數據清洗整理
2.2 網頁數據獲取
2.2.1 八爪魚採集原理與安裝
2.2.2 模板採集任務
2.2.3 自定義採集模式
第3章 數據分析入門
3.1 Weka簡介與數據預處理
3.1.1 軟體下載
3.1.2 文件與數據格式
3.1.3 Weka程序界面
3.1.4 數據預處理
3.2 數據分類
3.2.1 J48決策樹分類器
3.2.2 LinearRegression分類器
3.2.3 M5P分類器
3.3 數據聚類
3.3.1 SimpleKMeans聚類器
3.3.2 EM聚類器
3.3.3 DBSCAN聚類器
3.4 數據關聯
3.4.1 關聯規則相關概念
3.4.2 Apriori演算法介紹
3.4.3 Weka中Apriori關聯規則挖掘
3.5 選擇屬性
3.5.1 屬性選擇概述
3.5.2 Weka中Select attributes標籤頁
3.5.3 選擇屬性模式介紹
3.5.4 Weka中選擇屬性操作示例
3.6 數據可視化
3.6.1 Visualize標籤頁
3.6.2 數值型類別屬性可視化
第4章 數據分析進階
4.1 貝葉斯網路
4.1.1 貝葉斯公式簡介
4.1.2 貝葉斯網路簡介
4.1.3 創建貝葉斯網路
4.1.4 使用貝葉斯網路進行推理
4.2 神經網路
4.2.1 神經網路介紹
4.2.2 Weka神經網路選項設置
4.2.3 編輯神經網路
4.2.4 神經網路參數調整
4.3 時間序列分析及預測
第5章 Tableau數據可視化
5.1 Tableau概述與入門
5.1.1 概述
5.1.2 下載與安裝
5.1.3 數據類型
5.1.4 Tableau Desktop軟體界面
5.1.5 文件類型
5.2 初級可視化分析
5.2.1 條形圖
5.2.2 直方圖
5.2.3 餅圖
5.2.4 折線圖
5.2.5 壓力圖
5.2.6 樹地圖
5.2.7 氣泡圖
5.3 地圖分析
5.3.1 認識地圖
5.3.2 創建地圖
5.4 高級數據操作
5.4.1 分層結構
5.4.2 組
5.4.3 集
5.4.4 參數
5.4.5 計算欄位
5.5 分析圖表整合
5.6 案例一:無錫市宜居時間分析
5.6.1 創建計算欄位
5.6.2 空氣質量
5.6.3 氣溫
5.6.4 宜居時間
5.6.5 製作儀錶板
5.7 案例二:佛山市納稅企業增長情況分析
5.7.1 創建欄位
5.7.2 預測
5.7.3 剖析-行業
5.7.4 剖析-區域
5.7.5 製作儀錶板
5.7.6 分析
第6章 數據分析拓展
6.1 數據分析拓展引言
6.1.1 研究背景及實驗數據
6.1.2 研究方法
6.2 k-最近鄰演算法
6.2.1 k-最近鄰演算法的基本原理
6.2.2 Weka中k-最近鄰演算法(k-NN)應用實踐
6.3 支持向量機
6.3.1 支持向量機演算法基本原理
6.3.2 Weka中SVM演算法應用實踐
6.4 邏輯回歸演算法
6.4.1 邏輯回歸演算法基本原理
6.4.2 Weka中的邏輯回歸演算法應用實踐
6.5 隨機森林演算法
6.5.1 隨機森林演算法基本原理
6.5.2 Weka中的隨機森林演算法應用實踐
6.6 模型性能評估(一)
6.7 模型性能評估(二)
第7章 數據思維
7.1 數據分析基礎
7.1.1 相關概念
7.1.2 數據分析可以幫用戶做什麼
7.1.3 如何做有效的數據分析
7.2 數據分析思維、過程和方法
7.2.1 數據分析思維
7.2.2 數據分析過程
7.2.3 數據分析方法
7.2.4 數據分析結果展示
參考文獻