幫助中心 | 我的帳號 | 關於我們

大數據技術入門到商業實戰(Hadoop+Spark+Flink全解析)/數字化人才職場賦能系列叢書

  • 作者:編者:李偉傑//王超//李沙//劉雪松|責編:尚晨
  • 出版社:機械工業
  • ISBN:9787111686187
  • 出版日期:2021/08/01
  • 裝幀:平裝
  • 頁數:238
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書全面詳細地介紹了大數據生態系統中的主流技術。全書共10章,主要包括大數據生態系統概述、大數據採集技術、大數據存儲技術、大數據分析處理技術等內容,書中涵蓋了Hadoop、Hive、Hbase、Kafka、Spark、Flink等技術的原理和實踐,其中重點介紹了Hadoop技術、Spark技術及Flink技術。
    本書詳細介紹了主流大數據技術框架的基本原理、環境搭建、操作使用和在典型行業中的具體應用,使讀者不僅能夠在宏觀上全面認知大數據生態系統,而且還能在微觀上深入理解大數據技術細節。
    本書不僅適合大數據技術初學者閱讀,還可以幫助金融、電信、電商、能源、政府部門的大數據應用決策和技術人員,以及IT經理、CTO、CIO等快速學習大數據技術,並能作為大數據相關崗位培訓的教程。

作者介紹
編者:李偉傑//王超//李沙//劉雪松|責編:尚晨

目錄
前言
第1章  初識大數據
  1.1  什麼是大數據
  1.2  大數據行業應用
  1.3  什麼是Hadoop
  1.4  Hadoop產生背景
  1.5  Hadoop的架構模塊介紹
  1.6  Hadoop在大數據、雲計算中的位置和關係
  1.7  國內外Hadoop應用案例介紹
  1.8  Hadoop生態圈以及各組成部分簡介
  1.9  本章小結
第2章  Hadoop之分散式文件系統HDFS
  2.1  構建Hadoop集群
    2.1.1  集群簡介
    2.1.2  Hadoop集群部署
  2.2  Hadoop集群啟動和停止
    2.2.1  Hadoop集群啟動
    2.2.2  Hadoop集群停止
  2.3  HDFS的Shell命令行客戶端操作
  2.4  HDFS的工作機制
    2.4.1  HDFS概述
    2.4.2  HDFS的重要特性
    2.4.3  HDFS寫數據流程
    2.4.4  HDFS讀數據流程
  2.5  NameNode和SecondaryNameNode功能剖析
    2.5.1  NameNode與SecondaryNameNode解析
    2.5.2  元數據的checkpoint的條件
    2.5.3  fsimage與edits詳解
    2.5.4  fsimage和edits文件信息查看
  2.6  DataNode的工作機制及存儲
    2.6.1  DataNode工作機制
    2.6.2  數據完整性保證
    2.6.3  DataNode掉線判斷時限參數
  2.7  HDFS的安全模式
  2.8  本章小結
第3章  Hadoop之分散式計算MapReduce
  3.1  MapReduce概述
    3.1.1  MapReduce介紹
    3.1.2  為什麼要使用MapReduce
  3.2  MapReduce框架結構及核心運行機制
  3.3  MapReduce編程規範和示例編寫
    3.3.1  編程規範
    3.3.2  MapReduce編程入門之單詞計數
  3.4  MapTask數量及切片機制
    3.4.1  MapTask個數
    3.4.2  如何控制MapTask的個數
  ……
第4章  分散式協調服務Zookeeper
第5章  分散式資料庫Hbase
第6章  數據倉庫Hive

第7章  日誌採集框架Flume
第8章  分散式消息系統Kafka
第9章  Spark內存計算框架
第10章  Flink實時流處理

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032