幫助中心 | 我的帳號 | 關於我們

基於鯤鵬的大數據挖掘演算法實戰/鯤鵬計算應用技術系列/電腦企業核心技術叢書

  • 作者:袁春//劉婧//王工藝|責編:游靜
  • 出版社:機械工業
  • ISBN:9787111713180
  • 出版日期:2022/10/01
  • 裝幀:平裝
  • 頁數:231
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書結合主流分散式計算框架、國產晶元,介紹演算法極致性能優化實踐,開發麵向企業級應用的高性能數據挖掘演算法,剖析數據挖掘演算法的典型應用案例,幫助讀者在面向數據挖掘演算法科研問題、企業應用時快速構建應用。
    本書具體介紹了機器學習和數據挖掘的方法在大數據環境下的具體演算法原理與流程,以及在華為鯤鵬平台的具體實現,是第一本貫穿分散式計算框架、底層晶元的,指導面向企業級應用的數據挖掘演算法的書籍,適合作為高校、科研機構中需要對大規模數據進行挖掘和分析的學生、科研人員以及企業中大數據分析應用研發人員的參考用書。

作者介紹
袁春//劉婧//王工藝|責編:游靜

目錄
叢書序
前言
第1章  大數據挖掘技術概述
  1.1  大數據技術重要性
  1.2  大數據概念和類型
  1.3  大數據挖掘技術
    1.3.1  大數據採集技術
    1.3.2  大數據預處理技術
    1.3.3  大數據分析和挖掘技術
    1.3.4  大數據可視化技術
    1.3.5  大數據應用
  1.4  大數據挖掘系統架構
    1.4.1  大數據存儲系統
    1.4.2  大數據處理系統
    1.4.3  大數據可視化和應用系統
  1.5  大數據挖掘技術的特性
  1.6  新技術浪潮下的大數據挖掘技術
  參考文獻
第2章  分散式開發框架
  2.1  分散式並行策略
    2.1.1  數據並行
    2.1.2  模型並行
  2.2  分散式協調
    2.2.1  ZooKeeper簡介
    2.2.2  數據模型
    2.2.3  ZooKeeper體系結構
    2.2.4  分散式鎖
  2.3  分散式通信
    2.3.1  分散式通信機制
    2.3.2  分散式通信拓撲
  2.4  分散式一致性演算法
    2.4.1  一致性哈希
    2.4.2  Paxos演算法
    2.4.3  Raft演算法
  2.5  分散式計算框架
    2.5.1  Hadoop
    2.5.2  Spark
    2.5.3  Flink
    2.5.4  Ray
  參考文獻
第3章  經典挖掘演算法
  3.1  主成分分析
    3.1.1  演算法介紹
    3.1.2  演算法推導
  3.2  線性回歸
    3.2.1  線性回歸的損失函數
    3.2.2  優化求解方法
    3.2.3  正則化
  3.3  邏輯回歸
    3.3.1  Logistic函數

    3.3.2  邏輯回歸的損失函數
    3.3.3  多分類問題
  3.4  線性支持向量機
    3.4.1  支持向量機的基本概念
    3.4.2  線性支持向量機的損失函數
  3.5  決策樹
    3.5.1  決策樹演算法概述
    3.5.2  ID3決策樹演算法
    3.5.3  C4.5演算法
    3.5.4  分類回歸樹(CART)
  3.6  隨機森林
  3.7  梯度提升決策樹
    3.7.1  負梯度與殘差
    3.7.2  GBDT的計算原理
    3.7.3  GBDT常用的損失函數
  3.8  XGBoost
    3.8.1  XGBoost預測模型
    3.8.2  目標函數
    3.8.3  XGBoost演算法分析
  3.9  交替小二乘法
    3.9.1  顯式反饋
    3.9.2  隱式反饋
  參考文獻
第4章  鯤鵬BoostKit大數據挖掘
  4.1  鯤鵬晶元
    4.1.1  鯤鵬晶元的發展
    4.1.2  鯤鵬920處理器
    4.1.3  鯤鵬920處理器的特點
  4.2  鯤鵬BoostKit使能大數據場景
    4.2.1  鯤鵬應用使能套件BoostKit
    4.2.2  鯤鵬BoostKit大數據使能套件
  4.3  鯤鵬BoostKit大數據機器學習演算法庫
    4.3.1  演算法介紹
    4.3.2  機器學習演算法庫的使用方法
第5章  數據挖掘演算法在鯤鵬的優化實踐
  5.1  主成分分析
    5.1.1  Covariance方法實現
    5.1.2  SVD方法實現
    5.1.3  鯤鵬BoostKit演算法API介紹
  5.2  邏輯回歸
    5.2.1  概念回顧
    5.2.2  優化求解
    5.2.3  分散式實現
    5.2.4  鯤鵬BoostKit演算法API介紹
  5.3  隨機森林
    5.3.1  隨機森林基礎回顧
    5.3.2  隨機森林分散式實現與優化
    5.3.3  鯤鵬BoostKit演算法API介紹
  5.4  XGBoost
    5.4.1  XGBoost的基礎回顧

    5.4.2  XGBoost4J-Spark實現詳解
    5.4.3  XGBoost單輪分散式訓練實現詳解
    5.4.4  鯤鵬BoostKit演算法API介紹
  5.5  交替小二乘法
    5.5.1  分散式實現流程
    5.5.2  分散式實現詳解
    5.5.3  鯤鵬BoostKit演算法API介紹
  參考文獻
第6章  數據挖掘演算法應用案例
  6.1  商品推薦案例
    6.1.1  場景介紹
    6.1.2  整體方案
    6.1.3  關鍵步驟
    6.1.4  小結
  6.2  房價預測案例
    6.2.1  場景介紹
    6.2.2  整體方案
    6.2.3  關鍵步驟
    6.2.4  小結
  6.3  客戶細分案例
    6.3.1  場景介紹
    6.3.2  整體方案
    6.3.3  關鍵步驟
    6.3.4  小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032