幫助中心 | 我的帳號 | 關於我們

大數據分析原理與實踐/數據科學與工程技術叢書

  • 作者:編者:王宏志
  • 出版社:機械工業
  • ISBN:9787111569435
  • 出版日期:2017/07/01
  • 裝幀:平裝
  • 頁數:443
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    王宏志編著的《大數據分析原理與實踐》介紹了大數據分析的多種模型、所涉及的演算法和技術、實現大數據分析系統所需的工具以及大數據分析的具體應用。
    本書共16章。第1章為緒論,就大數據、大數據分析等概念進行了闡釋,並對本書內容進行了概述;第2-7章介紹了關聯分析模型、分類分析模型、聚類分析模型、結構分析模型和文本分析模型;第8章介紹大數據分析的數據預處理問題;第9章介紹降維方法;第10章介紹了數據倉庫的概念、內涵、組成、體系結構和建立方法,還介紹了分散式數據倉庫系統和內存數據倉庫系統。第11章介紹大數據分析演算法中的回歸演算法、關聯規則挖掘演算法、分類演算法以及聚類演算法的實現。第12-14章介紹了三種用於實現大數據分析演算法的平台,即並行計算平台、流式計算平台和大圖分析平台。第15章和第16章介紹兩類大數據分析的具體應用,分別講述了社會網路分析和推薦系統。
    本書可作為高等院校大數據相關專業的教學用書,也可以作為從事大數據相關工作的工程技術人員的參考用書。

作者介紹
編者:王宏志
    王宏志,哈爾濱工業大學電腦科學與技術學院副教授、博士生導師。研究方向包括大數據管理、數據質量、圖數據管理。發表學術論文140余篇,出版學術專著兩本,參與翻譯《演算法導論(第3版)》。在愛課程網、學堂在線、好大學在線上首次開設「大數據演算法」在線課程,出版《大數據演算法》教材。

目錄

前言
教學建議
第1章 緒論
  1.1 什麼是大數據
  1.2 哪裡有大數據
  1.3 什麼是大數據分析
  1.4 大數據分析的過程、技術與難點
  1.5 全書概覽
  小結
  習題
第2章 大數據分析模型
  2.1 大數據分析模型建立方法
  2.2 基本統計量
    2.2.1 全表統計量
    2.2.2 皮爾森相關係數
  2.3 推斷統計
    2.3.1 參數估計
    2.3.2 假設檢驗
    2.3.3 假設檢驗的阿里雲實現
  小結
  習題
第3章 關聯分析模型
  3.1 回歸分析
    3.1.1 回歸分析概述
    3.1.2 回歸模型的拓展
    3.1.3 回歸的阿里雲實現
  3.2 關聯規則分析
  3.3 相關分析
  小結
  習題
第4章 分類分析模型
  4.1 分類分析的定義
  4.2 判別分析的原理和方法
    4.2.1 距離判別法
    4.2.2 Fisher判別法
    4.2.3 貝葉斯判別法
  4.3 基於機器學習分類的模型
    4.3.1 支持向量機
    4.3.2 邏輯回歸
    4.3.3 決策樹與回歸樹
    4.3.4 k近鄰
    4.3.5 隨機森林
    4.3.6 樸素貝葉斯
  4.4 分類分析實例
    4.4.1 二分類實例
    4.4.2 多分類實例
  小結
  習題
第5章 聚類分析模型

  5.1 聚類分析的定義
    5.1.1 基於距離的親疏關係度量
    5.1.2 基於相似係數的相似性度量
    5.1.3 個體與類以及類間的親疏關係度量
    5.1.4 變數的選擇與處理
  5.2 聚類分析的分類
  5.3 聚類有效性的評價
  5.4 聚類分析方法概述
  5.5 聚類分析的應用
  5.6 聚類分析的阿里雲實現
  小結
  習題
第6章 結構分析模型
  6.1 最短路徑
  6.2 鏈接排名
  6.3 結構計數
  6.4 結構聚類
  6.5 社團發現
    6.5.1 社團的定義
    6.5.2 社團的分類
    6.5.3 社團的用途
    6.5.4 社團的數學定義
    6.5.5 基於阿里雲的社團發現
  小結
  習題
第7章 文本分析模型
  7.1 文本分析模型概述
  7.2 文本分析方法概述
    7.2.1 Sp itWord
    7.2.2 詞頻統計
    7.2.3 TF-IDF
    7.2.4 P DA
    7.2.5 Word2Vec
  小結
  習題
第8章 大數據分析的數據預處理
  8.1 數據抽樣和過濾
    8.1.1 數據抽樣
    8.1.2 數據過濾
    8.1.3 基於阿里雲的抽樣和過濾實現
  8.2 數據標準化與歸一化
  8.3 數據清洗
    8.3.1 數據質量概述
    8.3.2 缺失值填充
    8.3.3 實體識別與真值發現
    8.3.4 錯誤發現與修復
  小結
  習題
第9章 降維
  9.1 特徵工程

    9.1.1 特徵工程概述
    9.1.2 特徵變換
    9.1.3 特徵選擇
    9.1.4 特徵重要性評估
  9.2 主成分分析
    9.2.1 什麼是主成分分析
    9.2.2 主成分分析的計算過程
    9.2.3 基於阿里雲的主成分分析
    9.2.4 主成分的表現度量
  9.3 因子分析
    9.3.1 因子分析概述
    9.3.2 因子分析的主要分析指標
    9.3.3 因子分析的計算方法
  9.4 壓縮感知
    9.4.1 什麼是壓縮感知
    9.4.2 壓縮感知的具體模型
    9.5 面向神經網路的降維
    9.5.1 面向神經網路的降維方法概述
    9.5.2 如何利用神經網路降維
  9.6 基於特徵散列的維度縮減
    9.6.1 特徵散列方法概述
    9.6.2 特徵散列演算法
  9.7 基於asso演算法的降維
    9.7.1 asso方法簡介
    9.7.2 asso方法
    9.7.3 asso演算法的適用情景
  小結
  習題
第10章 面向大數據的數據倉庫系統
  10.1 數據倉庫概述
    10.1.1 數據倉庫的基本概念
    10.1.2 數據倉庫的內涵
    10.1.3 數據倉庫的基本組成
    10.1.4 數據倉庫系統的體系結構
    10.1.5 數據倉庫的建立
  10.2 分散式數據倉庫系統
    10.2.1 基於Hadoop的數據倉庫系統
    10.2.2 Shark:基於Spark的數據倉庫系統
    10.2.3 Mesa
  10.3 內存數據倉庫系統
    10.3.1 SAP HANA
    10.3.2 HyPer
  10.4 阿里雲數據倉庫簡介
  小結
  習題
第11章 大數據分析演算法
  11.1 大數據分析演算法概述
  11.2 回歸演算法
  11.3 關聯規則挖掘演算法
  11.4 分類演算法

    11.4.1 二分類演算法
    11.4.2 多分類演算法
  11.5 聚類演算法
    11.5.1 k-means演算法
    11.5.2 C ARANS演算法
  小結
  習題
第12章 大數據計算平台
  12.1 Spark
    12.1.1 Spark簡介
    12.1.2 基於Spark的大數據分析實例
  12.2 Hyracks
    12.2.1 Hyracks簡介
    12.2.2 基於Hyracks的大數據分析實例
  12.3 DPark
  ……
第13章 流式計算平台
第14章 大圖計算平台
第15章 社交網路
第16章 推薦系統
參考文獻
附錄

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032