幫助中心 | 我的帳號 | 關於我們

Hadoop大數據技術與應用(大數據專業應用型人才培養規劃教材)

  • 作者:編者:方曙東//許桂秋|責編:羅璀
  • 出版社:浙江科技
  • ISBN:9787534188947
  • 出版日期:2020/01/01
  • 裝幀:平裝
  • 頁數:336
人民幣:RMB 62.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書作為Hadoop的入門教材,採用理論與實踐相結合的方式,全面介紹了Hadoop大數據技術。它將幫助您:
    ·使用Hadoop分散式文件系統(HDFS)來存儲海量數據集,通過MapReduce對這些數據集進行分散式計算。
    ·使用Hadoop YARN資源管理器統一管理和調度Hadoop資源。
    ·熟悉Hadoop的數據和I/O構件,用於壓縮、數據集成、序列化和持久處理。
    ·洞悉編寫MapReduce實際應用時的常見陷阱和高級特性。
    ·設計、構建和管理一個專用的Hadoop集群或在雲上運行Hadoop。
    ·使用高級查詢語言Pig來處理大規模數據。
    ·利用Hadoop資料庫HBase來保存和處理結構化/半結構化數據。
    ·利用HIVE數據倉庫工具對Hadoop文件中的數據集進行數據整理、特殊查詢和分析存儲。
    ·利用SqoopSqoop在關係資料庫以及Hadoop數據存儲和處理平台進行數據導入、導出。
    ·學會利用ZooKeeper來構建分散式系統。
    ·學會利用Ambari來構建、管理、監控Hadoop生態的集群。
    本書直接將相關行業典型案例作為實驗教學內容編入,展示了如何用Hadoop解決實際行業場景中的問題,對實際操作更有針對性。本書可作為高等院校數據科學與大數據技術、電腦、信息管理等相關專業的大數據入門教材。

作者介紹
編者:方曙東//許桂秋|責編:羅璀

目錄
第1章  初識Hadoop大數據技術
  1.1  大數據技術概述
  1.2  Google的「三駕馬車
  1.3  Hadoop概述
  1.4  Hadoop生態圈
  1.5  Hadoop的典型應用場景與應用架構
第2章  Hadoop環境設置
  2.1  安裝前準備
  2.2  Hadoop的安裝
  實驗1  搭建Hadoop偽分散式模式環境
第3章  HDFS
  3.1  HDFS簡介
  3.2  HDFS的組成與架構
  3.3  HDFS的工作機制
  3.4  HDFS操作
  3.5  HDFS的高級功能
  實驗2  通過Shall命令訪問HDFS
  實驗3  熟悉基於IDEA+Maven的Java開發環境
  實驗4  通過API訪問HDFS
第4章  YARN
  4.1  YARN產生的背景
  4.2  初識YARN
  4.3  YARN的架構
  4.4  YARN的調度器
第5章  MapReduce
  5.1  MapReduce概述
  5.2  MapReduce編程模型
  5.3  MapReduce編程進階
  5.4  MapReduce的工作機制
  5.5  MapReduce編程案例
  實驗5  分析和編寫WordCount程序
  實驗6  MapReduce序列化、分區實驗
  實驗7  使用MapReduce求出各年銷售筆數、各年銷售總額
  實驗8  使用MapReduce統計用戶在搜狗_k_gs搜索數據
第6章  HBase、Hive、Pig
  6.1  HBase
  6.2  Hive
  6.3  Pig
  實驗9  HBase實驗——安裝和配置(可選)
  實驗10  HBase實驗——通過ItBase Shell訪問HBase(可選)
  實驗11  HBase實驗——通過JavaAPI訪問HBase
  實驗12  HBase實驗——通過Java API開發基於HBase的MapReduce程序
  實驗13  Hive實驗——Metastore採用Local模式(MySQL資料庫)搭建Hive環境(可選)
  實驗14  Hive實驗——Hive常用操作
  實驗15 Pig實驗——安裝和使用Pig(可選)
  實驗16 Pig實驗——使用Pig Latin操作員工表和部門表
第7章  Flume
  7.1  Flume產生的背景
  7.2  Flume簡介
  7.3  Flume的安裝

  7.4  Flume的架構
  7.5  Flume的應用
  7.6  Flume的工作方式
  實驗17  Flume的配置與使用1——Avro Source+Memory Channel+Logger Sink
  實驗18  Flume的配置與使用2--Syslogtcp Source+Memory Channel HDFS Sink
  實驗19  Fhune的配置與使用3——Exec Source+Memory Channel+ Logger Sink
第8章  Sqoop
  8.1  Sqoop背景簡介
  8.2  Sqoop的基本原理
  8.3  Sqoop的安裝與部署
  8.4  Sqoop應用
  實驗20  Sqoop常用功能的使用
第9章  ZooKeeper
  9.1  ZooKeeper簡介
  9.2  ZooKeeper的安裝
  9.3  ZooKeeper的基本原理
  9.4  ZooKeeper的簡單操作
  9.5  ZooKeeper的特性
  9.6  ZooKeeper的應用場景
  實驗21  ZooKeeper的3種訪問方式
第10章  Ambari
  10.1  Ambari簡介
  10.2  Ambari的安裝
  10.3  利用Ambari管理Hadoop集群
  1O.4  Ambari的架構和工作原理
第11章  Mahout
  11.1  Mahout簡介
  11.2  Taste簡介
  11.3  使用Taste構建推薦系統
  實驗22  基於Mahout的電影推薦系統
  實驗23  搜狗日誌查詢分析(MapReduce+Hive綜合實驗)

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032