幫助中心 | 我的帳號 | 關於我們

大數據技術體系詳解(原理架構與實踐)/大數據技術叢書

  • 作者:董西成
  • 出版社:機械工業
  • ISBN:9787111590729
  • 出版日期:2018/03/01
  • 裝幀:平裝
  • 頁數:361
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    董西成著的這本《大數據技術體系詳解(原理架構與實踐)》是一部系統、深度講解大數據技術棧的著作,從數據收集、數據存儲、資源管理與服務協調、計算引擎、數據分析5個層次講解了整個大數據技術體系中所有核心技術的原理、架構與實踐。不僅能讓讀者從宏觀上全面認識整個大數據系統,而且能讓讀者從微觀上深入理解各種大數據技術的細節。
    本書將以數據在大數據系統中的生命周期為線索,一共16章,分為6個部分:
    第一部分(第l章):慨述
    主要介紹企業級大數據技術框架、技術實現方案和架構,包括Google的大數據技術棧和以Hadoop和Spark為代表的開源技術棧。
    第二部分(第2?4章):數據收集
    講解大數據收集相關技術,主要涉及關係型數據收集工具sqoop與canel,非關係型數據收集系統Flume以及分散式消息隊列Kafka。
    第三部分(第5?7章):數據存儲
    講解大數據存儲相關技術,涉及數據存儲格式、分散式文件系統以及分散式資料庫三部分,包括Thrift、Protobuf、Avro、HDFS和HBase等。
    第四部分(第8?9章):分散式協調與資源管理
    講解資源管理和服務協調相關技術,涉及資源管理和調度系統YARN以及資源協調系統z00keeper。
    第五部分(第10?13章):汁算引擎
    講解計算引擎相關技術,涉及批處理、互動式處理以及流式實時處理三類引擎,包括MapReduce、Spark、Impala/Presto、Storm等常用技術。
    第六部分(第14?16章):數據分析
    講解數據分析相關技術,涉及基於數據分析的語言HQL與SQL,大數據統一編程模型及機器學習庫等。

作者介紹
董西成
    董西成,資深大數據技術實踐者和研究者,對大數據基礎架構有非常深刻的認識和理解,有著豐富的實踐經驗。熟悉常見的開源大數據解決方案,包括Hadoop和spark生態系統等,擅長底層分散式系統的優化和開發。撰寫了大量Had00p和spark等大數據相關的技術文章並分享在自己的博客上,由於文章技術含量高,所以非常受歡迎。    出版有大數據領域負有盛名的專著:《Hadoop技術內幕:深入解析MapReduce架構設計與實現原理》和《Had00p技術內幕:深入解析YARN架構設計與實現原理》。    微信公眾賬號:hadoopl23(大量關於大數據最新資訊和乾貨分享)

目錄
前言
第一部分 概述篇
第1章 企業級大數據技術體系概述
  1.1 大數據系統產生背景及應用場景
    1.1.1 產生背景
    1.1.2 常見大數據應用場景
  1.2 企業級大數據技術框架
    1.2.1 數據收集層
    1.2.2 數據存儲層
    1.2.3 資源管理與服務協調層
    1.2.4 計算引擎層
    1.2.5 數據分析層
    1.2.6 數據可視化層
  1.3 企業級大數據技術實現方案
    1.3.1 Google大數據技術棧
    1.3.2 Hadoop與Spark開源大數據技術棧
  1.4 大數據架構:Lambda Architecture
  1.5 Hadoop與Spark版本選擇及安裝部署
    1.5.1 Hadoop與Spark版本選擇
    1.5.2 Hadoop與Spark安裝部署
  1.6 小結
  1.7 本章問題
第二部分 數據收集篇
第2章 關係型數據的收集
  2.1 Sqoop概述
    2.1.1 設計動機
    2.1.2 Sqoop基本思想及特點
  2.2 Sqoop基本架構
    2.2.1 Sqoop1基本架構
    2.2.2 Sqoop2基本架構
    2.2.3 Sqoop1與Sqoop2對比
  2.3 Sqoop使用方式
    2.3.1 Sqoop1使用方式
    2.3.2 Sqoop2使用方式
  2.4 數據增量收集CDC
    2.4.1 CDC動機與應用場景
    2.4.2 CDC開源實現Canal
    2.4.3 多機房數據同步系統Otter
  2.5 小結
  2.6 本章問題
……
第3章 非關係型數據的收集
第4章 分散式消息隊列Kafka
第三部分 數據存儲篇
第5章 數據序列化與文件存儲格式
第6章 分散式文件系統
第7章 分散式結構化存儲系統
第四部分 分散式協調與資源管理篇
第8章 分散式協調服務ZooKeeper
第9章 資源管理與調度系統YARN

第五部分 大數據計算引擎篇
第10章 批處理引擎MapReduce
第11章 DAG計算引擎Spark
第12章 互動式計算引擎
第13章 流式實時計算引擎
第六部分 數據分析篇
第14章 數據分析語言HQL與SQL
第15章 大數據統一編程模型
第16章 大數據機器學習庫

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032