幫助中心 | 我的帳號 | 關於我們

Cloudera Hadoop大數據平台實戰指南

  • 作者:宋立桓//陳建平
  • 出版社:清華大學
  • ISBN:9787302517535
  • 出版日期:2019/02/01
  • 裝幀:平裝
  • 頁數:240
人民幣:RMB 59 元      售價:
放入購物車
加入收藏夾

內容大鋼
    對於入門和學習大數據技術的讀者來說,大數據技術的生態圈和知識體系過於龐大,可能還沒有開始學習就已經陷入眾多的陌生名詞和泛泛的概念中。宋立桓、陳建平著的《Cloudera Hadoop大數據平台實戰指南》的切入點明確而清晰,從Hadoop生態系統的明星Cloudera入手,逐步引出各類大數據基礎和核心應用框架。
    本書分為18章,系統介紹Hadoop生態系統大數據相關的知識,包括大數據概述、Cloudera Hadoop平台的安裝部署、HDFS分散式文件系統、MapReduce計算框架、資源管理調度框架YARN、Hive數據倉庫、數據遷移工具Sqoop、分散式資料庫HBase、ZooKeeper分散式協調服務、准實時分析系統Impala、日誌採集工具Flume、分散式消息系統Kafka、ETL工具Kettle、Spark計算框架等內容,最後給出兩個綜合實操案例,以鞏固前面所學的知識點。
    本書既適合Hadoop初學者、大數據技術工程師和大數據技術愛好者自學使用,亦可作為高等院校和培訓機構大數據相關課程的培訓用書。

作者介紹
宋立桓//陳建平

目錄
第1章  大數據概述
  1.1  大數據時代的數據特點
  1.2  大數據時代的發展趨勢——數據將成為資產
  1.3  大數據時代處理數據理念的改變
    1.3.1  要全體不要抽樣
    1.3.2  要效率不要絕對精確
    1.3.3  要相關不要因果
  1.4  大數據時代的關鍵技術
  1.5  大數據時代的典型應用案例
    1.5.1  塔吉特超市精準營銷案例
    1.5.2  谷歌流感趨勢案例
    1.5.3  證券行業案例
    1.5.4  某運營商大數據平台案例
  1.6  Hadoop概述和介紹
    1.6.1  Hadoop發展歷史和應用現狀
    1.6.2  Hadoop的特點
    1.6.3  Hadoop的生態系統
第2章  Cloudera大數據平台介紹
  2.1  Cloudera簡介
  2.2  Cloudera的Hadoop發行版CDH簡介
    2.2.1  CDH概述
    2.2.2  CDH和Apache Hadoop對比
  2.3  Cloudera Manager大數據管理平台介紹
    2.3.1  Cloudera Manager概述和整體架構
    2.3.2  Cloudera Manager的基本核心功能
    2.3.3  Cloudera Manager的高級功能
  2.4  Cloudera平台參考部署架構
    2.4.1  Cloudera的軟體體系結構
    2.4.2  群集硬體規劃配置
    2.4.3  Hadoop集群角色分配
    2.4.4  網路拓撲
第3章  Cloudera Manager及CDH離線安裝部署
  3.1  安裝前的準備工作
  3.2  Cloudera Manager及CDH安裝
  3.3  添加其他大數據組件
第4章  分散式文件系統HDFS
  4.1  HDFS簡介
  4.2  HDFS體系結構
    4.2.1  HDFS架構概述
    4.2.2  HDFS命名空間管理
    4.2.3  NameNode
    4.2.4  SecondaryNameNode
    4.3  HDFS 2.0新特性
    4.3.1  HDFS HA
    4.3.2  HDFS Federation
  4.4  HDFS操作常用shell命令
    4.4.1  HDFS目錄操作和文件處理命令
    4.4.2  HDFS的Web管理界面
    4.4.3  dfsadmin管理維護命令
    4.4.4  namenode命令
  4.5  Java編程操作HDFS實踐
  4.6  HDFS的參數配置和規劃
  4.7  使用Cloudera Manager啟用HDFS HA
    4.7.1  HDFS HA高可用配置
    4.7.2  HDFS HA高可用功能測試
第5章  分散式計算框架MapReduce
  5.1  MapReduce概述
  5.2  MapReduce原理介紹
    5.2.1  工作流程概述
    5.2.2  MapReduce框架的優勢
    5.2.3  MapReduce執行過程
  5.3  MapReduce編程——單詞示例解析
  5.4  MapReduce應用開發
    5.4.1  配置MapReduce開發環境
    5.4.2  編寫和運行MapReduce程序
第6章  資源管理調度框架YARN
  6.1  YARN產生背景
  6.2  YARN框架介紹
  ……
第7章  數據倉庫Hive
第8章  數據遷移工具Sqoop
第9章  分散式資料庫HBase
第10章  分散式協調服務ZooKeeper
第11章  准實時分析系統Impala
第12章  日誌採集工具Flume
第13章  分散式消息系統Kafka
第14章  大數據ETL工具Kettle
第15章  大規模數據處理計算引擎Spark
第16章  大數據全棧式開發語言Python
第17章  大數據實戰案例:實時數據流處理項目
第18章  大數據實戰案例:用戶日誌綜合分析項目
  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032