幫助中心 | 我的帳號 | 關於我們

HCIA-Big Data學習指南/華為ICT認證系列叢書

  • 作者:編者:華為技術有限公司|責編:李靜
  • 出版社:人民郵電
  • ISBN:9787115649355
  • 出版日期:2024/10/01
  • 裝幀:平裝
  • 頁數:202
人民幣:RMB 89.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以大數據為中心,對大數據及其相關技術、產品和實踐案例進行了詳細的講解。全書共分9章,從大數據概述、華為大數據產品入手,詳細介紹了開源的分散式計算框架——Hadoop,以及Hadoop生態圈的多個組件:Flume、Kafka、HDFS、Zookeeper、MapReduce、YARN、HBase、Hive、Spark以及Flink;除上述組件外,還介紹了ElasticSearch和ClickHouse。
    本書適合正在準備考取華為HCIA-Big Data認證的人員、從事大數據工作的專業人員閱讀,也可作為高等院校相關專業師生的參考書。

作者介紹
編者:華為技術有限公司|責編:李靜

目錄
第1章  大數據概述
  1.1  什麼是大數據
    1.1.1  大數據的來源
    1.1.2  大數據的發展歷程
  1.2  大數據的數據特徵及數據類型
  1.3  華為鯤鵬大數據
  1.4  大數據的發展趨勢
  1.5  華為DataArts Studio
    1.5.1  什麼是DataArts Studio
    1.5.2  DataArts Studio產品功能
    1.5.3  DataArts Studio應用場景
  1.6  華為雲大數據服務——MRS
  習題
第2章  大數據採集與分散式流處理平台
  2.1  大數據採集技術
  2.2  Flume
    2.2.1  Flume簡介及框架
    2.2.2  Flume的關鍵特性
    2.2.3  Flume應用舉例
  2.3  Kafka
    2.3.1  Kafka簡介
    2.3.2  Kafka的架構與功能
    2.3.3  Kafka數據管理
  習題
第3章  大數據分散式處理概述
  3.1  大數據開發與分散式技術簡介
    3.1.1  大數據開發
    3.1.2  分散式管理技術
  3.2  Hadoop——分散式大數據系統
    3.2.1  Hadoop簡介
    3.2.2  Hadoop 3.x
  3.3  Hadoop的體系架構
  3.4  Hadoop與分散式開發
  3.5  Hadoop的生態系統
  習題
第4章  HDFS分散式文件系統和ZooKeeper
  4.1  分散式文件系統
    4.1.1  分散式文件系統的設計思路
    4.1.2  最早的分散式文件系統
    4.1.3  大數據環境下分散式文件系統的優化思路
  4.2  HDFS的體系架構及特點
    4.2.1  HDFS的體系架構
    4.2.2  HDFS的特點
  4.3  HDFS的完整性
    4.3.1  校驗和
    4.3.2  運行後台進程來檢測數據塊
  4.4  HDFS數據的讀/寫流程
  4.5  HDFS的常用工具
    4.5.1  FsShell實現
    4.5.2  DFSAdmin實現

  4.6  ZooKeeper分散式協調服務
    4.6.1  ZooKeeper概述
    4.6.2  ZooKeeper的體系結構
    4.6.3  ZooKeeper奇數節點和偶數節點
  習題
第5章  分散式計算——MapReduce和YARN
  5.1  什麼是MapReduce
  5.2  MapReduce編程模型
    5.2.1  MapReduce簡單模型
    5.2.2  MapReduce複雜模型
    5.2.3  WordCount案例
  5.3  MapReduce數據流及任務流
    5.3.1  MapReduce數據流
    5.3.2  MapReduce任務流
  5.4  YARN概述
  5.5  YARN的基本框架
  5.6  YARN的工作流程
  習題
第6章  分散式資料庫技術——HBase
  6.1  海量數據與NoSQL
    6.1.1  關係資料庫的局限
    6.1.2  CAP理論
    6.1.3  NoSQL
  6.2  HBase簡介
  6.3  HBase表視圖
    6.3.1  HBase邏輯視圖
    6.3.2  HBase物理視圖
  6.4  HBase物理存儲模型
  6.5  HBase的基本操作
    6.5.1  HBase Shell的命令
    6.5.2  general操作
    6.5.3  DDL(數據定義語言)操作
  習題
第7章  分散式數據倉庫技術——Hive
  7.1  什麼是Hive
    7.1.1  Hive的本質
    7.1.2  Hive的基礎架構
  7.2  Hive的安全性
    7.2.1  默認授權模式
    7.2.2  基於存儲的授權模式
    7.2.3  基於SQL標準的授權模式
  7.3  Hive Shell
  7.4  Hive的性能調優
    7.4.1  分區表
    7.4.2  存儲優化
    7.4.3  矢量化查詢優化
  7.5  HQL簡介
    7.5.1  認識HQL
    7.5.2  Hive管理數據的方式
  習題

第8章  ClickHouse與ElasticSearch分散式搜索
  8.1  ClickHouse概述
  8.2  ClickHouse的架構及其基本特性
    8.2.1  ClickHouse的架構
    8.2.2  ClickHouse的基本特性
  8.3  ClickHouse的使用案例
  8.4  ElasticSearch簡介
  8.5  ElasticSearch的架構及其基本特性
    8.5.1  ElasticSearch的架構
    8.5.2  ElasticSearch的基本特性
  8.6  ElasticSearch的使用案例
  習題
第9章  大數據實時處理技術
  9.1  Spark——分散式技術
    9.1.1  Spark概述與架構
    9.1.2  彈性分散式數據集
    9.1.3  Spark的擴展功能
    9.1.4  Spark的應用舉例
  9.2  Flink——分散式實時處理引擎
    9.2.1  Flink的原理與架構
    9.2.2  Flink的運行架構
    9.2.3  Flink應用舉例
  習題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032