幫助中心 | 我的帳號 | 關於我們

Hadoop海量數據處理(技術原理與項目實踐)

  • 作者:許政|責編:王中英
  • 出版社:清華大學
  • ISBN:9787302666943
  • 出版日期:2024/08/01
  • 裝幀:平裝
  • 頁數:336
人民幣:RMB 99.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書從Hadoop的基礎知識講起,逐步深入Hadoop分散式文件系統(HDFS)和MapReduce分散式編程框架的核心技術,幫助讀者全面、系統、深入地理解Hadoop海量數據處理技術的精髓。本書在講解技術原理時穿插大量的典型示例,並詳解兩個典型項目實戰案例,幫助讀者提高實際項目開發水平。
    本書共15章,分為4篇。第1篇Hadoop基礎知識,包括大數據概述、Hadoop概述、Hadoop環境搭建與配置;第2篇Hadoop分散式存儲技術,包括HDFS概述、HDFS基礎操作、HDFS的讀寫原理和工作機制、Hadoop 3.x的新特性;第3篇MapReduce分散式編程框架,包括MapReduce概述、MapReduce開發基礎、MapReduce框架的原理、MapReduce數據壓縮、YARN資源調度器、Hadoop企業級優化;第4篇項目實戰,包括Hadoop高可用集群搭建實戰和統計TopN經典項目案例實戰。
    本書通俗易懂、案例豐富、實用性強,適合Hadoop初學者和進階人員閱讀,也適合大數據工程師、數據分析工程師和數據科學家等大數據技術從業人員和愛好者閱讀,還適合作為高等院校和相關培訓機構的大數據教材。

作者介紹
許政|責編:王中英
    許政,畢業於哈爾濱工業大學,獲碩士學位。現居深圳,任某一線大廠大數據架構師。參加工作以來,帶領團隊完成了多個百億級大數據平台的建設。在實時計算方面有深厚的實踐經驗。熟悉多種大數據技術框架,如Hadoop、Spark、Flink、Elasticsearch、Kafka、HBase、ZooKeeper等。被CSDN評為優秀博主,撰寫了大數據技術相關博文100余篇,博客訪問量高達240多萬。運維自己的獨立博客網站。在大數據實時處理技術和人工智慧演算法方面有深入的研究,申請發明專利10余項。

目錄
第1篇  Hadoop基礎知識
  第1章  大數據概述
    1.1  大數據簡介
    1.2  大數據的特點
    1.3  大數據的發展前景
    1.4  大數據技術生態體系
      1.4.1  數據採集與傳輸類
      1.4.2  數據存儲與管理類
      1.4.3  資源管理類
      1.4.4  數據計算類
      1.4.5  任務調度類
    1.5  大數據部門的組織架構
    1.6  小結
  第2章  Hadoop概述
    2.1  Hadoop簡介
    2.2  Hadoop的發展歷史
    2.3  Hadoop的三大發行版本
    2.4  Hadoop的優勢
    2.5  Hadoop各版本之間的區別
    2.6  Hadoop的組成
      2.6.1  HDFS架構簡介
      2.6.2  YARN架構簡介
      2.6.3  MapReduce架構簡介
    2.7  小結
  第3章  Hadoop環境搭建與配置
    3.1  搭建開發環境
      3.1.1  對操作系統的要求
      3.1.2  對軟體環境的要求
      3.1.3  下載和安裝JDK
      3.1.4  配置JDK環境變數
      3.1.5  下載和安裝Hadoop
      3.1.6  配置Hadoop的環境變數
      3.1.7  配置Hadoop的系統參數
      3.1.8  解讀Hadoop的目錄結構
    3.2  配置本地運行模式
      3.2.1  在Linux環境下運行Hadoop官方的Grep案例
      3.2.2  在Linux環境下運行Hadoop官方的WordCount案例
      3.2.3  在Windows環境下搭建Hadoop
      3.2.4  在Windows環境下運行WordCount案例
    3.3  配置偽分散式模式
      3.3.1  啟動HDFS井運行MapReduce程序
      3.3.2  啟動YARN並運行MapReduce程序
      3.3.3  配置歷史伺服器
      3.3.4  配置日誌的聚集功能
    3.4  配置完全分散式模式
      3.4.1  分散式集群環境準備
      3.4.2  配置完全分散式集群
      3.4.3  配置Hadoop集群單點啟動
      3.4.4  測試完全分散式集群
      3.4.5  配置Hadoop集群整體啟動

      3.4.6  配置Hadoop集群時間同步
    3.5  小結
第2篇  Hadoop分散式存儲技術
  第4章  HDFS概述
    4.1  HDFS的背景和定義
      4.1.1  HDFS產生的背景
      4.1.2  HDFS的定義
    4.2  HDFS的優缺點
      4.2.1  HDFS的優點
      4.2.2  HDFS的缺點
    4.3  HDFS的組成架構
    4.4  設置HDFS文件塊的大小
    4.5  小結
  第5章  HDFS基礎操作
    5.1  HDFS的Shell命令操作
      5.1.1  HDFS的幫助命令
      5.1.2  顯示HDFS的目錄信息
      5.1.3  創建HDFS目錄
  ……
第3篇  MapReduce分散式編程框架
第4篇  項目實戰

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032