幫助中心 | 我的帳號 | 關於我們

SQL機器學習庫MADlib技術解析

  • 作者:王雪迎
  • 出版社:清華大學
  • ISBN:9787302518945
  • 出版日期:2019/02/01
  • 裝幀:平裝
  • 頁數:342
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    MADlib是一套SQL中的大數據機器學習庫。通常SQL查詢能發現數據最明顯的模式和趨勢,但要想獲取數據中最為有用的信息,需要的則是一套牢固紮根于數學和應用數學的技能,這就是機器學習。如果將SQL的簡單易用與MADlib機器學習的複雜演算法結合起來,就能實現簡單的機器學習功能。
    王雪迎著的《SQL機器學習庫MADlib技術解析》分為11章,從MADlib的基本概念、MADlib的架構、支持的模型類型與功能入手,詳細解析MADlib各種模型的具體用法,包括數據類型、矩陣分解、數據轉換、數據探索、主成分分析、回歸、時間序列分析、分類、聚類、關聯規則、圖演算法、模型評估等。每種模型將從背景知識、函數語法、應用示例三方面進行說明。
    本書適合MADlib機器學習的初學者、想學習MADlib機器學習的DBA以及從事數據分析與挖掘的高級技術人員閱讀,也適合高等院校與培訓學校相關專業的師生教學參考。

作者介紹
王雪迎
    王雪迎 ,畢業於中國地質大學電腦專業,高級工程師,20年資料庫、數據倉庫相關技術工作經驗。先後供職于北京現代商業信息技術有限公司、北京在線九州信息技術服務有限公司、華北計算技術研究所、北京優貝在線網路科技有限公司,擔任DBA、數據架構師等職位。著有圖書《Hadoop構建數據倉庫實踐》《HAWQ數據倉庫與數據挖掘實戰》《SQL機器學習庫MADlib技術解析》。

目錄
第1章  MADlib基礎
  1.1  基本概念
    1.1.1  MADlib是什麼
    1.1.2  MADlib的設計思想
    1.1.3  MADlib的工作原理
    1.1.4  MADlib的執行流程
    1.1.5  MADlib架構
  1.2  MADlib的功能
    1.2.1  MADlib支持的模型類型
    1.2.2  MADlib的主要功能模塊
  1.3  MADlib的安裝與卸載
    1.3.1  確定安裝平台
    1.3.2  下載MADlib二進位壓縮包
    1.3.3  安裝MADlib
    1.3.4  卸載MADlib
  1.4  小結
第2章  數據類型
  2.1  向量
    2.1.1  MADlib中的向量操作函數
    2.1.2  稀疏向量
  2.2  矩陣
    2.2.1  矩陣定義
    2.2.2  MADlib中的矩陣表示
    2.2.3  MADlib中的矩陣運算函數
  2.3  小結
第3章  數據轉換
  3.1  鄰近度
    3.1.1  MADlib的鄰近度相關函數
    3.1.2  距離度量的中心化和標準化
    3.1.3  選取正確的鄰近度度量
  3.2  矩陣分解
    3.2.1  低秩矩陣分解
    3.2.2  奇異值分解
  3.3  透視表
  3.4  分類變數編碼
  3.5  小結
第4章  數據探索
  4.1  描述性統計
    4.1.1  皮爾森相關
    4.1.2  匯總統計
  4.2  概率統計
    4.2.1  概率
    4.2.2  統計推論
  4.3  主成分分析
    4.3.1  背景知識
    4.3.2  MADlib的PCA相關函數
    4.3.3  MADlib的PCA應用示例
  4.4  小結
第5章  回歸
  5.1  線性回歸
    5.1.1  背景知識
    5.1.2  MADlib的線性回歸相關函數
    5.1.3  線性回歸示例
  5.2  非線性回歸
    5.2.1  背景知識
    5.2.2  MADlib的非線性回歸相關函數
    5.2.3  非線性回歸示例
  5.3  邏輯回歸
    5.3.1  背景知識
    5.3.2  MADlib的邏輯回歸相關函數
    5.3.3  邏輯回歸示例
  5.4  多類回歸
    5.4.1  背景知識
    5.4.2  MADlib的多類回歸相關函數
    5.4.3  多類回歸示例
  5.5  序數回歸
    5.5.1  背景知識
    5.5.2  MADlib的序數回歸相關函數
    5.5.3  序數回歸示例
  5.6  彈性網路回歸
    5.6.1  背景知識
    5.6.2  MADlib的彈性網路回歸相關函數
    5.6.3  彈性網路回歸示例
  5.7  小結
第6章  時間序列分析
  6.1  背景知識
    6.1.1  時間序列分析方法
    6.1.2  ARIMA模型
  6.2  MADlib中ARIMA相關函數
  6.3  時間序列分析示例
  6.4  小結
第7章  分類
  7.1  K近鄰
    7.1.1  背景知識
    7.1.2  MADlib中K近鄰函數
    7.1.3  K近鄰示例
  7.2  樸素貝葉斯
    7.2.1  背景知識
    7.2.2  MADlib中樸素貝葉斯分類相關函數
    7.2.3  樸素貝葉斯分類示例
  7.3  支持向量機
    7.3.1  背景知識
    7.3.2  MADlib的支持向量機相關函數
    7.3.3  支持向量機示例
  7.4  決策樹
    7.4.1  背景知識
    7.4.2  MADlib的決策樹相關函數
    7.4.3  決策樹示例
  7.5  隨機森林
    7.5.1  背景知識
    7.5.2  MADlib的隨機森林相關函數
    7.5.3  隨機森林示例
  7.6  小結
第8章  聚類
  8.1  背景知識
    8.1.1  聚類的概念
    8.1.2  k-means方法
  8.2  MADlib的k-means相關函數
    8.2.1  訓練函數
    8.2.2  簇分配函數
    8.2.3  輪廓係數函數
  8.3  k-means示例
  8.4  小結
第9章  關聯規則
  9.1  背景知識
    9.1.1  基本概念
    9.1.2  Apriori演算法
  9.2  MADlib的Apriori演算法函數
  9.3  Apriori應用示例
  9.4  小結
第10章  圖演算法
  10.1  背景知識
    10.1.1  基本概念
    10.1.2  常見圖演算法
    10.1.3  單源最短路徑
  10.2  MADlib的單源最短路徑相關函數
  10.3  單源最短路徑示例
  10.4  小結
第11章  模型評估
  11.1  交叉驗證
    11.1.1  背景知識
    11.1.2  MADlib的交叉驗證相關函數
    11.1.3  交叉驗證示例
  11.2  預測度量
  11.3  小結
  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032