幫助中心 | 我的帳號 | 關於我們

Hadoop大數據處理技術基礎與實踐(微課版第3版十四五職業教育國家規劃教材)

  • 作者:編者:安俊秀//靳宇倡//楊林旺//柳源//萬里浪等|責編:馬小霞
  • 出版社:人民郵電
  • ISBN:9787115638861
  • 出版日期:2024/08/01
  • 裝幀:平裝
  • 頁數:244
人民幣:RMB 59.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書共11章,從Hadoop概述開始,介紹Hadoop的安裝、配置與管理,並對Hadoop的生態體系架構進行介紹,包括HDFS技術、YARN技術、MapReduce技術、Hadoop I/O操作、海量資料庫技術HBase、ZooKeeper技術、分散式數據倉庫技術Hive,以及Hadoop與RDBMS數據遷移工具Sqoop,最後對大數據實時處理技術進行介紹,旨在讓讀者了解當前其他的大數據處理技術。本書還包括豐富的實踐操作,實現理論與實踐的有機結合。
    本書除介紹Hadoop的理論外,還介紹如何使用各組件,但因為只介紹基礎的使用方法,沒有涉及底層的高級內容,所以本書只起引導作用。本書旨在讓讀者了解Hadoop並能夠使用Hadoop的基本功能,並不是學習Hadoop的完整手冊。
    本書適合作為高等院校和職業院校大數據、物聯網、雲計算及其他電腦相關專業的教材,也可供雲計算與大數據技術相關專業的培訓班使用。

作者介紹
編者:安俊秀//靳宇倡//楊林旺//柳源//萬里浪等|責編:馬小霞

目錄
第1章  Hadoop概述
  1.1  Hadoop簡介
  1.2  Hadoop體系架構
    1.2.1  Hadoop基礎架構
    1.2.2  Hadoop生態系統
  1.3  Hadoop與分散式開發
  1.4  Hadoop行業應用案例分析
    1.4.1  Hadoop在門戶網站中的應用
    1.4.2  Hadoop在搜索引擎中的應用
    1.4.3  Hadoop在電商平台中的應用
  習題
第2章  Hadoop的安裝、配置與管理
  2.1  實驗準備
  2.2  配置一個單節點環境
    2.2.1  運行一個虛擬環境CentOS
    2.2.2  配置網路
    2.2.3  創建新的用戶組和用戶
    2.2.4  上傳文件到CentOS並配置Java和Hadoop環境
    2.2.5  修改Hadoop3.2配置文件
    2.2.6  修改CentOS主機名
    2.2.7  綁定hostname與IP地址
    2.2.8  關閉防火牆
  2.3  節點之間的免密碼登錄
    2.3.1  什麼是SSH
    2.3.2  複製虛擬機節點
    2.3.3  配置SSH免密碼登錄
  2.4  Hadoop的啟動和測試
    2.4.1  格式化文件系統
    2.4.2  啟動HDFS
    2.4.3  啟動YARN
    2.4.4  啟動JobHistoryServer
    2.4.5  集群驗證
    2.4.6  需要了解的默認配置
  2.5  動態管理節點
    2.5.1  動態增加和刪除DataNode
    2.5.2  動態修改TaskTracker
  習題
第3章  HDFS技術
  3.1  HDFS的特點
  3.2  HDFS架構
    3.2.1  數據塊
    3.2.2  NameNode與DataNode
    3.2.3  輔助NameNode
    3.2.4  安全模式與負載均衡
    3.2.5  垃圾回收
  3.3  HDFSShell命令
    3.3.1  文件處理命令
    3.3.2  互動式命令
  3.4  HDFS中JavaAPI的使用
    3.4.1  上傳文件

    3.4.2  新建文件
    3.4.3  查看文件詳細信息
    3.4.4  下載文件
  3.5  RPC通信
    3.5.1  反射機制
    3.5.2  代理模式與動態代理
    3.5.3  HadoopRPC機制與源碼分析
  習題
第4章  YARN技術
  4.1  YARN概述
    4.1.1  YARN產生背景——MRv1的局限性
    4.1.2  YARN的通信協議
  4.2  YARN基本框架
  4.3  YARN資源調度器
  4.4  YARN的工作流程
  4.5  YARN的實戰案例
  習題
第5章  MapReduce技術
  5.1  什麼是MapReduce
  5.2  MapReduce編程模型
    5.2.1  MapReduce模型簡介
    5.2.2  MapReduce模型分類
    5.2.3  MapReduce編程實例——WordCount
  5.3  MapReduce數據流
    5.3.1  分片並格式化原始數據(InputFormat)
    5.3.2  Map過程
    5.3.3  Shuffle過程
    5.3.4  Reduce過程
    5.3.5  按指定格式寫入文件(OutputFormat)
  5.4  MapReduce任務流程
  5.5  MapReduce的Streaming和Pipe
    5.5.1  HadoopStreaming
    5.5.2  HadoopPipe
  5.6  MapReduce性能調優
  5.7  MapReduce實戰
    5.7.1  快速入門
    5.7.2  簡單使用Eclipse插件
  習題
第6章  HadoopI/O操作
  6.1  HDFS數據完整性
    6.1.1  校驗和
    6.1.2  運行後台進程來檢測數據塊
  6.2  基於文件的數據結構
    6.2.1  SequenceFile的存儲
    6.2.2  MapFile的存儲
    6.2.3  SequenceFile轉換為MapFile
  6.3  壓縮
    6.3.1  認識壓縮
    6.3.2  Codec
    6.3.3  本地庫

    6.3.4  如何選擇壓縮格式
  6.4  序列化
    6.4.1  認識序列化
    6.4.2  Writable介面
    6.4.3  WritableComparable介面
    6.4.4  HadoopWritable基本類型
    6.4.5  自定義Writable類型
  習題
第7章  海量資料庫技術HBase
  7.1  初識HBase
  7.2  HBase表視圖
    7.2.1  概念視圖
    7.2.2  物理視圖
  7.3  HBase物理存儲模型
  7.4  安裝HBase
    7.4.1  HBase單節點安裝
    7.4.2  HBase偽分散式安裝
    7.4.3  HBase完全分散式安裝
  7.5  HBaseShell
    7.5.1  HBaseShell的命令
    7.5.2  general操作
    7.5.3  DDL操作
    7.5.4  DML操作
  7.6  HBase操作實踐
  習題
第8章  ZooKeeper技術
  8.1  分散式協調技術及其實現者
  8.2  ZooKeeper基本架構
  8.3  ZooKeeper數據模型
    8.3.1  Znode
    8.3.2  ZooKeeper中的時間
    8.3.3  Znode屬性
    8.3.4  watch觸發器
  8.4  ZooKeeper集群安裝
  8.5  ZooKeeper的主要Shell操作
  8.6  典型應用場景
    8.6.1  數據發布與訂閱
    8.6.2  統一命名服務
    8.6.3  分散式通知協調
  習題
第9章  分散式數據倉庫技術Hive
  9.1  Hive出現的原因
  9.2  Hive服務的組成
  9.3  Hive的安裝
    9.3.1  Hive基本安裝
    9.3.2  MySQL的安裝
    9.3.3  Hive的配置
  9.4  HiveShell
  9.5  HQL的概念和使用
    9.5.1  認識HQL

    9.5.2  Hive管理數據方式
    9.5.3  Hive表的DDL操作
    9.5.4  Hive表的DML操作
  9.6  使用Hive實現聊天數據分析案例
  習題
第10章  Hadoop與RDBMS數據遷移工具Sqoop
  10.1  Sqoop簡介及基本安裝
  10.2  Sqoop的配置
  10.3  Sqoop的相關功能
    10.3.1  Sqoop的工具命令
    10.3.2  Sqoop與MySQL
    10.3.3  sqoop-import操作
    10.3.4  sqoop-import-all-tables操作
    10.3.5  sqoop-export操作
    10.3.6  sqoop-list-databases和sqoop-list-tables操作
  10.4  Hive、Pig和Sqoop三者之間的關係
  10.5  基於Sqoop的MySQL和Hive之間的數據遷移實操案例
  習題
第11章  大數據實時處理技術
  11.1  Flink
    11.1.1  Flink架構
    11.1.2  Flink部署
    11.1.3  Flink的運行架構
    11.1.4  Flink流處理API
  11.2  Spark
    11.2.1  ApacheSpark架構
    11.2.2  ApacheSpark的擴展功能
  11.3  Flink與Spark異同
  習題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032