幫助中心 | 我的帳號 | 關於我們

Hadoop3大數據技術快速入門/大數據技術叢書

  • 作者:編者:牛搞|責編:夏毓彥
  • 出版社:清華大學
  • ISBN:9787302586463
  • 出版日期:2021/09/01
  • 裝幀:平裝
  • 頁數:245
人民幣:RMB 59 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書基於Hadoop 3.3.0,覆蓋Hadoop、HBase、Hive的核心概念、實踐應用、程序開發等方面的內容,幫你快速解決大數據是什麼和怎麼用的問題,書中還利用Docker來部署Hadoop分散式集群,讓你同時學會4種流行的技術。
    本書共9章,主要內容包括Hadoop概述、HDFS原理詳解、Yarn原理詳解、Hadoop系統配置、高可用Hadoop配置、HDFS編程、MapReduce編程、Hive實戰、HBase實戰。
    本書從案例入手、通俗易懂,能使讀者在最短時間內迅速掌握Hadoop大數據技術。本書既適合Hadoop大數據初學者、大數據應用開發人員、大數據處理人員使用,也適合高等院校和培訓機構大數據相關專業的師生教學參考。

作者介紹
編者:牛搞|責編:夏毓彥
    牛搞,軟體開發從業15年編程實戰經驗,流媒體技術專家,高性能伺服器專家。CSDN知名博主。現為IOS、Adroid、C++高級培訓講師。著有圖書《Android 9編程通俗演義》《Android 10 Kotlin編程通俗演義》。

目錄
第1章  概述
  1.1  什麼是大數據
    1.1.1  大數據系統的定位
    1.1.2  與傳統分散式系統的區別
    1.1.3  成功的大數據系統項目
  1.2  Hadoop的原理
    1.2.1  存儲與資源調度
    1.2.2  計算框架原理
  1.3  總結
第2章  HDFS原理詳解
  2.1  主從節點架構
  2.2  數據冗余
  2.3  fsimage與edits
  2.4  SecondaryNameNode
  2.5  HA
  2.6  自動故障轉移
  2.7  ZooKeeper
  2.8  防腦裂
  2.9  聯邦
  2.10  總結
第3章  Yarn原理詳解
  3.1  概述
  3.2  作業調度策略
    3.2.1  容量調度器
    3.2.2  公平調度器
    3.2.3  隊列其他事項
  3.3  Yarn與MapReduce程序
第4章  配置Hadoop系統
  4.1  Docker簡介
  4.2  安裝Docker
    4.2.1  Windows、macOS做宿主系統
    4.2.2  Linux做宿主系統
    4.2.3  測試Docker容器
  4.3  創建Hadoop容器
  4.4  配置獨立模式Hadoop
  4.5  配置偽分佈Hadoop
    4.5.1  安裝並配置SSH
    4.5.2  安裝其他命令行程序
    4.5.3  編輯core-site.xml
    4.5.4  編輯hdfs-site.xml
    4.5.5  編輯mapred-site.xml
    4.5.6  編輯yarn-site.xml
    4.5.7  編輯hadoop-env.sh
    4.5.8  運行偽分散式Hadoop
    4.5.9  狀態監控
  4.6  基於Dockerfile的偽分佈Hadoop
    4.6.1  Dockerfile
    4.6.2  構建Hadoop鏡像
    4.6.3  運行容器
    4.6.4  配置Hadoop

  4.7  配置全分散式Hadoop
    4.7.1  組件部署架構
    4.7.2  配置思路
    4.7.3  修改配置文件
    4.7.4  創建集群
    4.7.5  啟動集群
  4.8  Windows下運行Hadoop
    4.8.1  配置獨立模式Hadoop
    4.8.2  配置偽分散式Hadoop
  4.9  Yarn調度配置
    4.9.1  容量調度器
    4.9.2  公平調度器
第5章  配置高可用Hadoop
  5.1  HDFS高可用
    5.1.1  組件部署架構
    5.1.2  修改配置文件
    5.1.3  創建鏡像
    5.1.4  創建HA HDFS集群
    5.1.5  運行HA HDFS
    5.1.6  測試HA HDFS
    5.1.7  NameNode自動故障轉移
  5.2  Yarn高可用
第6章  HDFS編程
  6.1  安裝開發工具
    6.1.1  安裝Git
    6.1.2  安裝Maven
    6.1.3  安裝VSCode
    6.1.4  安裝VSCode插件
  6.2  Native編程
    6.2.1  創建HDFS客戶端項目
    6.2.2  示例1:查看目錄狀態
    6.2.3  添加依賴庫
    6.2.4  運行程序
    6.2.5  示例2:創建目錄和文件
    6.2.6  示例3:讀取文件內容
    6.2.7  示例4:上傳和下載文件
  6.3  WebHDFS與HttpFS
    6.3.1  WebHDFS
    6.3.2  VSCode插件RestClient
    6.3.3  HttpFS
第7章  MapReduce編程
  7.1  準備測試環境與創建項目
  7.2  添加MapReduce邏輯
    7.2.1  添加Map類
    7.2.2  添加Reduce類
  7.3  創建Job
  7.4  添加依賴庫
  7.5  運行程序
  7.6  查看運行日誌
  7.7  在Hadoop中運行程序

  7.8  Combiner
  7.9  Mapper與Reducer數量
  7.10  實現SQL語句
    7.10.1  簡單查詢
    7.10.2  排序
    7.10.3  複雜排序
    7.10.4  分區
    7.10.5  組合
    7.10.6  總結
  7.11  實現SQL JOIN
    7.11.1  INNER JOIN
    7.11.2  MapReduce實現JOIN
    7.11.3  Mapper JOIN
    7.11.4  DistributedCache
  7.12  Counter
  7.13  其他組件
  7.14  升級版的WordCount
  7.15  分散式k-means
    7.15.1  Mapper類
    7.15.2  Reducer類
    7.15.3  執行任務的方法
    7.15.4  輔助類
    7.15.5  運行
    7.15.6  MapReduce深入剖析
第8章  Hive
  8.1  Hive的設計架構
  8.2  運行架構
  8.3  安裝配置Hive
    8.3.1  安裝依賴軟體
    8.3.2  創建Hive鏡像Dockerfile
    8.3.3  創建docker-compose.yml
    8.3.4  Hadoop配置調整
    8.3.5  為Hive準備資料庫
  8.4  運行Hive
  8.5  其他運行方式
    8.5.1  MetaStore單獨運行
    8.5.2  嵌入Meta資料庫
    8.5.3  HiveServer2與beeline合體
  8.6  Hive數據管理
    8.6.1  基本操作
    8.6.2  Hive表
    8.6.3  數據傾斜
  8.7  Hive查詢優化
  8.8  索引
  8.9  HCatalog
  8.10  Hive編程
    8.10.1  JDBC操作Hive
    8.10.2  自定義函數
  8.11  總結
第9章  HBase

  9.1  什麼是HBase
  9.2  HBase架構
  9.3  安裝與配置
    9.3.1  獨立模式運行
    9.3.2  偽分佈模式
    9.3.3  全分佈模式
  9.4  基本數據操作
    9.4.1  表管理
    9.4.2  添加數據
    9.4.3  修改數據
    9.4.4  獲取數據
    9.4.5  刪除數據
  9.5  HBase設計原理
    9.5.1  Region
    9.5.2  定位數據
    9.5.3  數據存儲模型
    9.5.4  快速寫的秘密
    9.5.5  快速讀的秘密
    9.5.6  合併StoreFile
    9.5.7  Region拆分與合併
    9.5.8  故障恢復
    9.5.9  總結
  9.6  HBase應用編程
    9.6.1  Java API訪問HBase
    9.6.2  使用掃描過濾器
    9.6.3  MapReduce訪問HBase表
  9.7  總結
後記

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032