幫助中心 | 我的帳號 | 關於我們

白話大數據與機器學習

  • 作者:高揚//衛崢//尹會生
  • 出版社:機械工業
  • ISBN:9787111538479
  • 出版日期:2016/06/01
  • 裝幀:平裝
  • 頁數:328
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    資深大數據專家多年實戰經驗總結,拒絕晦澀,開啟大數據與機器學習妙趣之旅。以降低學習曲線和閱讀難度為宗旨,系統講解統計學、數據挖掘演算法、實際應用案例、數據價值與變現,以及高級拓展技能,並清晰勾勒出大數據技術路線與產業藍圖。
    高揚、衛崢、尹會生著的《白話大數據與機器學習》共分18章。用通俗易懂的語言,結合大量案例與漫畫,不枯燥,實用、接地氣。
    第1?5章,這部分是大數據入門所需的系統性知識,剖析大數據產業、數據與信息演算法等的關係,妙解數學基礎(排列組合、概率、統計與分佈),以及指標化運營及體系構建。這部分補足讀者的產業與相關概念認知,以及所需的數學知識。為下面的數據挖掘演算法的理解與應用夯實基礎。
    第6?8章,這部分介紹數據挖掘基礎知識與演算法,講解了與數據息息相關的資訊理論,重點講解了:多維向量空間(向量和維度、矩陣及其計算、上卷和下鑽);
    回歸(線性回歸、殘差分析、擬合相關問題);
    聚類(K-Means演算法、有趣模式、孤立點、層次與密度聚類,聚類的評估等);
    分類(樸素貝葉斯、決策樹歸納、隨機森林、隱馬爾科夫模型、SVM、遺傳演算法)。
    第11?18章,這部分介紹生產應用與高級擴展。其中第11?15章介紹生產應用實踐,涵蓋關聯分析、用戶畫像、推薦演算法、文本挖掘、人工神經網路。這些也是工業界和學術界研究的熱點。第16章講解了著名的大數據框架及其安裝與配置,如Hadoop、Spark、Cassandra、PrestoDB。第17章從速度與穩定性維度介紹了大數據系統的架構與調優。第18章則從數據運營、評估、展現與變現場景層面進行了解讀。
    附錄部分給出了大數據平台運行可能需要的軟體和庫,以及群眾如何看待炙手可熱的大數據。

作者介紹
高揚//衛崢//尹會生

目錄
第1章  大數據產業
  1.1  大數據產業現狀
  1.2  對大數據產業的理解
  1.3  大數據人才
    1.3.1  供需失衡
    1.3.2  人才方向
    1.3.3  環節和工具
    1.3.4  門檻障礙
  1.4  小結
第2章  步入數據之門
  2.1  什麼是數據
  2.2  什麼是信息
  2.3  什麼是演算法
  2.4  統計、概率和數據挖掘
  2.5  什麼是商業智能
  2.6  小結
第3章  排列組合與古典概型
  3.1  排列組合的概念
    3.1.1  公平的決斷——扔硬幣
    3.1.2  非古典概型
  3.2  排列組合的應用示例
    3.2.1  雙色球彩票
    3.2.2  購車搖號
    3.2.3  德州撲克
  3.3  小結
第4章  統計與分佈
  4.1  加和值、平均值和標準差
    4.1.1  加和值
    4.1.2  平均值
    4.1.3  標準差
  4.2  加權均值
    4.2.1  混合物定價
    4.2.2  決策權衡
  4.3  眾數、中位數
    4.3.1  眾數
    4.3.2  中位數
  4.4  歐氏距離
  4.5  曼哈頓距離
  4.6  同比和環比
  4.7  抽樣
  4.8  高斯分佈
  4.9  泊松分佈
  4.10  伯努利分佈
  4.11  小結
第5章  指標
  5.1  什麼是指標
  5.2  指標化運營
    5.2.1  指標的選擇
    5.2.2  指標體系的構建
  5.3  小結

第6章  資訊理論
  6.1  信息的定義
  6.2  信息量
    6.2.1  信息量的計算
    6.2.2  信息量的理解
  6.3  香農公式
  6.4  熵
    6.4.1  熱力熵
    6.4.2  信息熵
  6.5  小結
第7章  多維向量空間
  7.1  向量和維度
    7.1.1  信息冗余
    7.1.2  維度
  7.2  矩陣和矩陣計算
  7.3  數據立方體
  7.4  上卷和下鑽
  7.5  小結
第8章  回歸
  8.1  線性回歸
  8.2  擬合
  8.3  殘差分析
  8.4  過擬合
  8.5  欠擬合
  8.6  曲線擬合轉化為線性擬合
  8.7  小結
第9章  聚類
第10章  分類
第11章  關聯分析
第12章  用戶畫像
第13章  推薦演算法
第14章  文本挖掘
第15章  人工神經網路
第16章  大數據框架簡介
第17章  系統架構和調優
第18章  數據解讀與數據的價值
附錄A  VMwareWorkstation的安裝
附錄B  CentOS虛擬機的安裝方法
附錄C  Python語言簡介
附錄D  Scikit-learn庫簡介
附錄E  FANNforPython安裝
附錄F  群眾眼中的大數據
寫作花絮
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032