幫助中心 | 我的帳號 | 關於我們

Hadoop生態系統及開發(新一代信息技術系列教材)

  • 作者:編者:鄧永生//劉銘皓//張俊豪//邵成寬//張韜等|責編:吳禎娥//高櫻
  • 出版社:西安電子科大
  • ISBN:9787560669212
  • 出版日期:2023/08/01
  • 裝幀:平裝
  • 頁數:248
人民幣:RMB 49 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書主要圍繞Hadoop及其生態系統中的各種工具展開講解,重點介紹大數據分析處理的整體流程,剖析每個環節中所使用的不同組件的技術原理和特點。本書內容共分為七個模塊:模塊一為大數據基礎概述,主要講述大數據的概念、來源、應用場景、大數據時代的機遇和挑戰等相關內容;模塊二至模塊六以Hadoop生態系統為基礎,系統地講解了分散式文件系統HDFS、分散式計算框架MapReduce、分散式資源管理器YARN、分散式NoSQL資料庫HBase、分散式數據倉庫Hive、數據採集系統Flume和分散式發布訂閱消息系統Kafka,每一個模塊均附有大量的實訓內容,操作指導步驟詳細,以方便讀者掌握相關知識;模塊七為大數據日誌分析綜合項目案例,通過案例將前面模塊所學的內容融會貫通,以方便讀者掌握大數據開發的核心流程。
    本書由深圳市訊方技術股份有限公司與重慶機電職業技術大學共同編寫,並以新時代中國特色社會主義思想為思政面,每個模塊均融入思政元素,內容豐富、概念清晰,可作為大數據相關專業的教材,也可作為大數據領域技術人員及編程愛好者的參考用書。

作者介紹
編者:鄧永生//劉銘皓//張俊豪//邵成寬//張韜等|責編:吳禎娥//高櫻

目錄
模塊一  大數據基礎概述
  1.1  大數據的概念和價值
  1.2  大數據的來源
  1.3  大數據的應用場景
  1.4  大數據時代的機遇和挑戰
  1.5  Hadoop及其生態系統簡介
  1.6  大數據行業的人才需求狀況
  知識鞏固
模塊二  Hadoop分散式文件系統HDFS
  2.1  HDFS概述及基本概念
    2.1.1  HDFS概述
    2.1.2  HDFS的基本概念
  2.2  HDFS的系統架構與適用場景
    2.2.1  HDFS的系統架構
    2.2.2  HDFS的適用場景
  2.3  HDFS的操作方式
    2.3.1  常用Shell命令
    2.3.2  HDFS的數據寫入流程
    2.3.3  HDFS的數據讀取流程
  2.4  HDFS的關鍵特性
    2.4.1  HDFS的架構設計特性
    2.4.2  HDFS的高可用性
    2.4.3  元數據持久化
    2.4.4  HDFS的聯邦存儲機制
    2.4.5  HDFS的數據副本機制
    2.4.6  HDFS的數據存儲策略
    2.4.7  HDFS的數據完整性保障
    2.4.8  HDFS的其他關鍵特性
  技能實訓
    實訓2.1  基礎實訓環境準備
    實訓2.2  HDFS的安裝部署與配置
    實訓2.3  HDFS的讀寫API操作
  知識鞏固
模塊三  分散式計算框架MapReduce和分散式資源管理器YARN
  3.1  MapReduce和YARN概述
    3.1.1  MapReduce概述
    3.1.2  YARN概述
  3.2  MapReduce和YARN的工作過程與架構
    3.2.1  MapReduce的基本工作過程
    3.2.2  Shuffle過程
    3.2.3  YARN的組件架構
    3.2.4  MapReduce on YARN任務調度流程
    3.2.5  YARN RM的HA方案
  3.3  YARN的資源管理和任務調度
    3.3.1  資源管理及分配模型
    3.3.2  調度器的介紹
    3.3.3  Capacity調度器的特點與管理
    3.3.4  Fair調度器的特點與管理
    3.3.5  Capacity調度器與Fair調度器的對比與選型
  技能實訓

    實訓3.1  YARN集群的部署
    實訓3.2  單詞計數(WordCount)程序的編寫
  知識鞏固
模塊四  分散式NoSQL資料庫HBase
  4.1  HBase概述
    4.1.1  HBase簡介
    4.1.2  HBase與RDB的對比
    4.1.3  HBase的應用場景
    4.1.4  行存儲與列存儲
    4.1.5  Key-Value存儲模型
  4.2  HBase的架構
    4.2.1  HBase架構介紹
    4.2.2  Master
    4.2.3  RegionServer
    4.2.4  Region
    4.2.5  ColumnFamily
    4.2.6  各個組件之間的邏輯關係
  4.3  HBase的關鍵流程
    4.3.1  寫流程
    4.3.2  讀流程
  技能實訓
    實訓4.1  HBase的安裝與配置
    實訓4.2  HBase命令行之Shell操作
    實訓4.3  HBase的API操作
  知識鞏固
模塊五  分散式數據倉庫Hive
  5.1  Hive概述
    5.1.1  數據倉庫的概念及特點
    5.1.2  Hive的概念與HiveQL簡介
    5.1.3  Hive的應用場景
    5.1.4  Hive與傳統數據倉庫比較
    5.1.5  Hive的優缺點
  5.2  Hive的架構原理
    5.2.1  Hive的架構
    5.2.2  Hive的存儲模型與數據模型
    5.2.3  Hive的存儲格式
  5.3  Hive的基本操作
  5.4  HiveQL的應用
    5.4.1  數據定義語言(DDL)講解
    5.4.2  數據操縱語言(DML)講解
    5.4.3  數據查詢語言(DQL)講解
  技能實訓
    實訓5.1  Hive的安裝與部署
    實訓5.2  數據定義操作的具體實現
    實訓5.3  數據操縱操作的具體實現
    實訓5.4  查詢操作的具體實現
  知識鞏固
模塊六  Hadoop其他大數據生態組件
  6.1  數據採集系統Flume
    6.1.1  Flume簡介及其架構

    6.1.2  Flume的關鍵特性
  6.2  分散式發布訂閱消息系統Kafka
    6.2.1  Kafka簡介
    6.2.2  Kafka的架構與功能
    6.2.3  Kafka的常用命令
  技能實訓
    實訓6.1  Flume的安裝與部署
    實訓6.2  用Flume採集數據到HDFS
    實訓6.3  Kafka集群部署
    實訓6.4  發布訂閱消息系統Kafka的具體實現
  知識鞏固
模塊七  大數據日誌分析綜合項目案例
  7.1  項目準備
  7.2  項目實施
  7.3  項目總結
  知識鞏固
附錄1  搭建虛擬機環境
附錄2  大數據常用管理腳本
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032