幫助中心 | 我的帳號 | 關於我們

大數據原理與技術(華為信息與網路技術學院指定教材)/ICT認證系列叢書

  • 作者:編者:黃史浩|責編:李靜
  • 出版社:人民郵電
  • ISBN:9787115458711
  • 出版日期:2018/01/01
  • 裝幀:平裝
  • 頁數:255
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書是華為ICT學院大數據技術官方教材,旨在幫助學生進一步學習大數據的基本概念、技術原理,以及大數據平台的搭建和使用。
    本書從大數據的概念和特徵開始講起,首先讓讀者對大數據有一個感性的認識;接下來結合大數據平台的各個功能模塊,詳細介紹大數據的存儲、處理、分析、可視化等原理和操作;最後對大數據在各種行業中的應用加以敘述,讓讀者更加充分地感受到大數據應用的價值。
    除華為ICT學院的學生之外,本書同樣適合正在備考HCNA-Big Data認證,或者正在參加HCNA—BigData技術培訓的學員進行閱讀和參考。其他有志進入ICT行業的人員和大數據技術愛好者也可以通過閱讀本書,加深自己對大數據技術的理解。

作者介紹
編者:黃史浩|責編:李靜

目錄
第1章  大數據概述
  1.1 大數據的概念與價值
    1.1.1 什麼是大數據
    1.1.2 大數據的來源
    1.1.3 大數據有什麼價值
    1.1.4 如何挖掘企業大數據的價值
  1.2 大數據的關鍵技術
    1.2.1 大數據採集、預處理與存儲管理
    1.2.2 大數據分析與挖掘
    1.2.3 數據可視化
  1.3 大數據產業
    1.3.1 數據提供
    1.3.2 技術提供
    1.3.3 服務提供
  1.4 大數據應用場景
  1.5 本章總結
  練習題
第2章  Hadoop大數據處理平台
  2.1 Hadoop平台概述
    2.1.1 Hadoop簡介
    2.1.2 Hadoop的特性
    2.1.3 Hadoop應用現狀
    2.1.4 Hadoop版本及相關平台
  2.2 Hadoop生態系統
    2.2.1 Hadoop存儲系統(HDFS & HBase)
    2.2.2 Hadoop計算框架(MapReduce & YARN)
    2.2.3 Hadoop數據倉庫(Hive)
    2.2.4 Hadoop數據轉換與日誌處理(Sqoop & Flume)
    2.2.5 Hadoop應用協調與工作流(ZooKeeper & Oozie)
    2.2.6 大數據安全技術(Kerberos & LDAP)
    2.2.7 大數據即時查詢與搜索(Impala & Solr)
    2.2.8 大數據消息訂閱(Kafka)
  2.3 Hadoop安裝部署
    2.3.1 Hadoop規劃部署
    2.3.2 Hadoop的安裝方式
  2.4 華為FusionInsight HD安裝部署
    2.4.1 FusionInsight HD簡介
    2.4.2 FusionInsight HD集成設計
    2.4.3 FusionInsight HD安裝部署
    2.4.4 FusionInsight HD重要參數配置
  2.5 本章總結
  練習題
第3章  大數據存儲技術(HDFS)
  3.1 概述
    3.1.1 分散式文件系統的概念與作用
    3.1.2 HDFS概述
  3.2 HDFS的相關概念
    3.2.1 塊
    3.2.2 NameNode
    3.2.3 Secondary NameNode

    3.2.4 DataNode
  3.3 HDFS體系架構與原理
    3.3.1 HDFS體系架構
    3.3.2 HDFS的高可用機制
    3.3.3 HDFS的目錄結構
    3.3.4 HDFS的數據讀寫過程
  3.4 HDFS介面及其在FusionInsight HD編程中的實踐
    3.4.1 HDFS常用Shell命令
    3.4.2 HDFS的Web界面
    3.4.3 HDFS的Java介面及應用實例
  3.5 本章總結
  練習題
第4章  大數據離線計算框架(MapReduce & YARN)
  4.1 MapReduce技術原理
    4.1.1 MapReduce概述
    4.1.2 Map函數與Reduce函數
  4.2 YARN技術原理
    4.2.1 YARN的概述與應用
    4.2.2 YARN的架構
    4.2.3 MapReduce的計算過程
    4.2.4 YARN的資源調度
  4.3 FusionInsight HD中MapReduce的應用
    4.3.1 WordCount實例分析
    4.3.2 MapReduce編程實踐
  4.4 本章總結
  練習題
第5章  大數據資料庫(HBase)
  5.1 HBase概述
    5.1.1 HBase簡介
    5.1.2 HBase與關係型資料庫的區別
    5.1.3 HBase的應用場景
  5.2 HBase的架構原理
    5.2.1 HBase的數據模型
    5.2.2 表和Region
    5.2.3 HBase的系統架構與功能組件
    5.2.4 HBase的讀寫流程
    5.2.5 HBase的Compaction過程
  5.3 FusionInsight HD中HBase的編程實踐
    5.3.1 FusionInsight HD中HBase的常用參數配置
    5.3.2 HBase的常用Shell命令
    5.3.3 HBase常用的Java API及應用實例
  5.4 本章總結
  練習題
第6章  大數據數據倉庫(Hive)
  6.1 Hive概述
    6.1.1 Hive簡介和應用
    6.1.2 Hive的特性
    6.1.3 Hive與傳統數據倉庫的區別
  6.2 Hive的架構和數據存儲
    6.2.1 Hive的架構原理

    6.2.2 Hive的數據存儲模型
    6.2.3 HiveQL編程
  6.3 FusionInsight HD中Hive應用實踐
    6.3.1 FusionInsight HD中Hive的常用參數配置
    6.3.2 載入數據到
    6.3.3 使用HiveQL進行數據分析
  6.4 本章總結
  練習題
第7章  大數據數據轉換(Sqoop與Loader)
  7.1 Sqoop概述
    7.1.1 Sqoop簡介與應用
    7.1.2 Sqoop的功能與特性
    7.1.3 Sqoop與傳統ETL的區別
  7.2 FusionInsight HD中Loader的應用實踐
    7.2.1 FusionInsight HD中Loader與Sqoop的對比
    7.2.2 FusionInsight HD中Loader的參數配置
    7.2.3 使用Loader進行數據轉換
    7.2.4 Loader的常用Shell命令
    7.2.5 Loader應用實踐
  7.3 本章總結
  練習題
第8章  大數據日誌處理(Flume)
  8.1 Flume概述
    8.1.1 Flume簡介與應用
    8.1.2 Flume的功能與特性
    8.1.3 Flume與其他主流開源日誌收集系統的區別
  8.2 FusionInsight HD中Flume的應用實踐
    8.2.1 FusionInsight HD中Flume的常用參數配置
    8.2.2 Flume常用的Shell命令
    8.2.3 Flume與Kafka結合進行日誌處理
  8.3 本章總結
  練習題
第9章  大數據實時計算框架(Spark)
  9.1 Spark概述
    9.1.1 Spark的概述與應用
    9.1.2 Scala語言介紹
    9.1.3 Spark生態系統組件
    9.1.4 Spark與Hadoop的對比
  9.2 Spark技術架構
    9.2.1 Spark的運行原理
    9.2.2 RDD概念與原理
    9.2.3 Spark的三種部署方式
    9.2.4 使用開發工具測試Spark
  9.3 FusionInsight HD中Spark應用實踐
    9.3.1 運行Spark Shell
    9.3.2 進行Spark RDD操作
    9.3.3 使用Spark客戶端工具運行Spark程序
  9.4 Spark Streaming
    9.4.1 Spark Streaming的設計思想
    9.4.2 Spark Streaming的應用實例

  9.5 Spark SQL
    9.5.1 Spark SQL的功能
    9.5.2 FusionInsight HD中Spark SQL的應用實例
  9.6 Spark MLlib
    9.6.1 機器學習簡介
    9.6.2 Spark MLlib的功能
  9.7 Spark GraphX
    9.7.1 圖計算簡介
    9.7.2 Spark GraphX功能簡介
  9.8 本章總結
  練習題
第10章  大數據流計算
  10.1 流計算概述
    10.1.1 靜態數據和流數據
    10.1.2 流計算的概念
    10.1.3 MapReduce和流計算
    10.1.4 流計算框架
  10.2 流計算的處理流程
    10.2.1 數據實時採集
    10.2.2 數據實時計算
    10.2.3 數據實時查詢
  10.3 Streaming流計算
    10.3.1 Streaming簡介
    10.3.2 Streaming的特點
    10.3.3 Streaming在FusionInsight HD上的應用實踐
    10.3.4 Spark Streaming與Streaming的差異
  10.4 本章總結
  練習題
第11章  數據可視化
  11.1 可視化概述
    11.1.1 數據可視化簡介
    11.1.2 數據可視化的重要性
    11.1.3 可視化的發展歷程
    11.1.4 數據可視化的過程
  11.2 可視化工具
    11.2.1 入門級工具(Excel)
    11.2.2 普通工具(R語言)
    11.2.3 高級工具(Tableau和QlikView)
  11.3 可視化的典型應用
    11.3.1 可視化在醫學上的應用
    11.3.2 可視化在工程中的應用
    11.3.3 可視化在互聯網的應用
  11.4 本章總結
  練習題
第12章  大數據行業應用
  12.1 大數據在金融行業的應用
  12.2 大數據在電信行業的應用
  12.3 大數據在公安系統的應用
  12.4 大數據在互聯網行業的應用
  12.5 本章總結

  練習題
術語表
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032