幫助中心 | 我的帳號 | 關於我們

流數據分析技術(普通高等教育十三五規劃教材)/數據科學與大數據技術專業教材叢書

  • 作者:編者:李靜林//袁泉|責編:劉春棠
  • 出版社:北京郵電大學
  • ISBN:9787563559152
  • 出版日期:2020/01/01
  • 裝幀:平裝
  • 頁數:180
人民幣:RMB 38 元      售價:
放入購物車
加入收藏夾

內容大鋼
    流數據分析技術是一種實時或准實時的,對動態數據集合甚至無界時間序列數據進行特徵和態勢認知的技術,目前已經廣泛應用於互聯網/移動互聯網、物聯網、氣象、金融等多個領域,支撐運營管理、應用性能管理、監測與測控等多種服務,是大數據的重要研究方向之一。本書以流數據的基本特徵為核心內容,突出流數據與傳統大數據的聯繫與區別,介紹流數據的基本處理方法和分析方法。重點內容包括:流數據與流式計算、流數據處理技術、流數據分析技術、流數據處理模型與處理框架等。本書還介紹了流數據分析技術的一些最新進展及流計算框架的最新發展。
    本書可作為電腦學科相關專業,特別是數據科學與大數據技術專業的教材。

作者介紹
編者:李靜林//袁泉|責編:劉春棠

目錄
第1章  流數據與流計算
  1.1  大數據
    1.1.1  大數據的發展
    1.1.2  大數據的概念
    1.1.3  大數據思維
  1.2  流數據
    1.2.1  流數據的場景
    1.2.2  流數據的特點
    1.2.3  流數據的概念
  1.3  流數據處理
    1.3.1  批處理模型
    1.3.2  流式處理模型
    1.3.3  流式處理與窗口模型
    1.3.4  流式處理與概要結構
    1.3.5  批處理與流式處理的對比
  1.4  流數據分析
    1.4.1  頻繁項挖掘演算法
    1.4.2  聚類演算法
    1.4.3  分類演算法
    1.4.4  回歸演算法
  1.5  流數據機器學習
  1.6  小結
  本章知識點
  擴展閱讀
  習題1
第2章  流數據概要結構構建技術
  2.1  流數據處理的概要結構
  2.2  抽樣概要結構
    2.2.1  抽樣
    2.2.2  伯努利抽樣
    2.2.3  水庫抽樣
    2.2.4  簡明抽樣
  2.3  草圖概要結構
    2.3.1  草圖
    2.3.2  計數草圖
    2.3.3  增廣草圖
    2.3.4  布隆過濾器
    2.3.5  FM基數估計草圖
  2.4  小波概要結構
  2.5  直方圖概要結構
    2.5.1  直方圖
    2.5.2  等寬直方圖
  2.6  小結
  本章知識點
  擴展閱讀
  習題2
第3章  流數據頻繁模式挖掘技術
  3.1  頻繁模式挖掘問題的定義
  3.2  不同窗口模型的頻繁模式挖掘
  3.3  頻繁項挖掘演算法

    3.3.1  黏性抽樣演算法
    3.3.2  KPS演算法
  3.4  頻繁模式挖掘演算法
    3.4.1  有損計數演算法
    3.4.2  有損計數演算法擴展
  3.5  頻繁模式挖掘的其他相關問題
  3.6  小結
  本章知識點
  擴展閱讀
  習題3
第4章  流數據聚類分析技術
  4.1  聚類演算法
  4.2  流數據聚類的評價
    4.2.1  內部度量
    4.2.2  外部度量
  4.3  不同窗口模型的聚類分析
  4.4  基於劃分的流數據聚類演算法
    4.4.1  STREAM演算法
    4.4.2  K-Center演算法
  4.5  基於層次的流數據聚類演算法
  4.6  基於密度的流數據聚類演算法
  4.7  基於網格的流數據聚類演算法
  4.8  其他流數據聚類演算法
    4.8.1  K-Median演算法
    4.8.2  BIRCH演算法
  4.9  小結
  本章知識點
  擴展閱讀
  習題4
第5章  流數據分類分析技術
  5.1  。分類演算法
  5.2  流數據分類的評價
    5.2.1  誤差估計
    5.2.2  性能評價指標
    5.2.3  統計顯著性
    5.2.4  成本度量
  5.3  基於貝葉斯的分類演算法
  5.4  基於決策樹的分類演算法
    5.4.1  快速決策樹演算法
    5.4.2  概念自適應快速決策樹演算法
  5.5  其他流數據分類演算法
    5.5.1  VFDTc和UFFT演算法
    5.5.2  Hoeffding自適應樹演算法
  5.6  小結
  本章知識點
  擴展閱讀
  習題5
第6章  流數據學習與時間序列分析技術
  6.1  時間序列
    6.1.1  時間序列的分類與特徵

    6.1.2  時間序列的表示與擬合
    6.1.3  時間序列的預測
  6.2  在線學習模型
  6.3  流數據學習評價
    6.3.1  誤差
    6.3.2  Regret界
  6.4  模型學習演算法
    6.4.1  ARIMA演算法
    6.4.2  在線ARIMA演算法
  6.5  實例學習演算法
    6.5.1  嶺回歸與LASSO回歸
    6.5.2  FIMT演算法
    6.5.3  AMRules演算法
  6.6  最優化演算法
    6.6.1  SGD演算法
    6.6.2  FTRL演算法
  6.7  小結
  本章知識點
  擴展閱讀
  習題6
第7章  流數據處理模型與框架
  7.1  流數據處理計算模型
  7.2  流計算的狀態與一致性
    7.2.1  流計算的狀態
    7.2.2  流計算的一致性
  7.3  流計算處理中的時間
  7.4  流計算實現框架
  7.5  Storm流處理框架
    7.5.1  基於流的處理拓撲結構
    7.5.2  記錄級容錯
    7.5.3  Storm的系統架構
  7.6  Spark流處理框架
    7.6.1  基於RDD的微批處理結構
    7.6.2  基於RDD依賴的容錯
    7.6.3  Spark的系統架構
  7.7  Flink流處理框架
    7.7.1  基於流水線的處理結構
    7.7.2  基於分散式快照的容錯
    7.7.3  Flink的系統架構
  7.8  小結
  本章知識點
  擴展閱讀
  習題7
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032