幫助中心 | 我的帳號 | 關於我們

Hadoop數據倉庫實戰(新技術技能人才培養系列教程)/大數據核心技術系列

  • 作者:編者:肖睿//蘭偉//廖春瓊|責編:祝智敏
  • 出版社:人民郵電
  • ISBN:9787115526090
  • 出版日期:2020/01/01
  • 裝幀:平裝
  • 頁數:242
人民幣:RMB 52 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以Hive為開發平台,主要介紹了如何使用HiveQL來查詢和分析存儲在Hadoop分散式文件系統上的大數據集合,具體內容包括Hive入門、Hive資料庫及表操作、Hive元數據、Hive高級操作、Hive函數與Streaming、Hive視圖與索引、Hive調優、Hive與HBase集成、數據遷移框架Sqoop等。本書介紹的每個任務都運用了大量案例,緊密結合實際應用,融入了含金量十足的開發經驗。在此基礎上,本書通過豐富的練習和操作實踐,幫助讀者鞏固所學的內容。本書配以多元的學習資源和支持服務,包括視頻、案例素材、學習社區等,為讀者提供全方位的學習體驗。
    本書適合作為電腦、大數據等相關專業的教材,也適合具有一定Linux或Java開發基礎且想從事大數據開發的人員閱讀學習,還可以作為大數據分析與運維人員的參考用書。

作者介紹
編者:肖睿//蘭偉//廖春瓊|責編:祝智敏

目錄
第1章  Hive入門
  任務1  了解Hive基礎
    1.1.1  認識Hive
    1.1.2  Hive架構設計
    1.1.3  Hive工作流程
    1.1.4  Hive適用場景
  任務2  掌握Hive數據存儲模型
    1.2.1  Hive存儲格式
    1.2.2  Hive數據單元
    1.2.3  Hive存儲模型
  任務3  安裝配置Hive環境
    1.3.1  Hive的發展歷程
    1.3.2  搭建Hive CDH環境
    1.3.3  Hive初體驗
    1.3.4  Hive開發環境
    1.3.5  技能實訓
  本章小結
  本章作業
第2章  Hive資料庫及表操作
  任務1  熟悉Hive數據類型
    2.1.1  基本數據類型
    2.1.2  複雜數據類型
  任務2  使用Hive管理僱員信息
    2.2.1  Hive DDL操作
    2.2.2  Hive DML操作
    2.2.3  Hive Shell
    2.2.4  技能實訓
  任務3  使用Hive Java API操作僱員表
    2.3.1  開發環境搭建
    2.3.2  JDBC操作Hive資料庫
    2.3.3  技能實訓
  本章小結
  本章作業
第3章  Hive元數據
  任務1  訪問僱員數據的元數據信息
    3.1.1  Hive元數據的概念及存儲方式
    3.1.2  僱員數據元數據信息查詢
    3.1.3  技能實訓
  任務2  使用Hive Java API讀取僱員表元數據
    3.2.1  hive-metastore組件
    3.2.2  使用HiveMetaStoreClient訪問元數據
    3.2.3  技能實訓
  任務3  使用HCatalog管理僱員數據的元數據
    3.3.1  HCatalog介紹
    3.3.2  HCatalog應用
  本章小結
  本章作業
第4章  Hive高級操作
  任務1  關聯查詢零售商店訂單明細
    4.1.1  SELECT語句

    4.1.2  關聯查詢
    4.1.3  聯合查詢
    4.1.4  技能實訓
  任務2  使用分組排序實現商品銷售排行
    4.2.1  排序
    4.2.2  分組聚合
    4.2.3  技能實訓
  任務3  使用窗口函數實現零售數據統計
    4.3.1  窗口函數
    4.3.2  窗口的定義
    4.3.3  技能實訓
  本章小結
  本章作業
第5章  Hive函數與Streaming
  任務1  應用內置函數
    5.1.1  函數概述
    5.1.2  內置函數詳解
    5.1.3  技能實訓
  任務2  使用Java編寫Hive自定義函數
    5.2.1  自定義函數概述
    5.2.2  UDF
    5.2.3  UDAF
    5.2.4  UDTF
    5.2.5  技能實訓
  任務3  使用Streaming實現數據處理
    5.3.1  Streaming概念
    5.3.2  Streaming應用
    5.3.3  技能實訓
  本章小結
  本章作業
第6章  Hive視圖與索引
  任務1  創建並管理零售商店的顧客表和訂單表視圖
    6.1.1  視圖的基本概念及使用場景
    6.1.2  視圖的基本操作
    6.1.3  Materialized Views和Lateral View
    6.1.4  技能實訓
  任務2  建立零售商店顧客表索引
    6.2.1  Hive索引的基本概念及使用場景
    6.2.2  為零售商店顧客表建立索引
    6.2.3  與索引相關的元數據表
    6.2.4  技能實訓
  本章小結
  本章作業
第7章  Hive調優
  任務1  熟悉Hive性能調優策略
    7.1.1  Hive性能調優使用工具
    7.1.2  優化Map Task和Reduce Task個數
    7.1.3  Hive Job優化
    7.1.4  Hive Query優化
    7.1.5  設置壓縮

    7.1.6  技能實訓
  任務2  解決Hive數據傾斜問題
    7.2.1  數據傾斜問題
    7.2.2  數據傾斜問題解決方案
  任務3  Hive集成Tez
    7.3.1  Tez簡介
    7.3.2  Tez安裝配置
    7.3.3  Hive與Tez集成
    7.3.4  技能實訓
  本章小結
  本章作業
第8章  Hive與HBase集成
  任務1  理解Hive與HBase集成的場景及原理
    8.1.1  Hive與HBase集成的應用場景
    8.1.2  Hive與HBase集成原理
  任務2  實現Hive與HBase集成
    8.2.1  Hive與HBase集成配置
    8.2.2  Hive與HBase集成功能測試
    8.2.3  將零售商店顧客購買統計信息存入HBase表
    8.2.4  技能實訓
  任務3  使用Phoenix操作HBase資料庫
    8.3.1  Phoenix簡介
    8.3.2  搭建Phoenix CDH環境
    8.3.3  技能實訓
  本章小結
  本章作業
第9章  數據遷移框架Sqoop
  任務1  使用Sqoop完成Hadoop與MySQL間的數據遷移
    9.1.1  Sqoop簡介
    9.1.2  導入MySQL數據到HDFS
    9.1.3  導入MySQL數據到Hive
    9.1.4  導入MySQL數據到HBase
    9.1.5  導出HDFS數據到MySQL
    9.1.6  技能實訓
  任務2  使用Sqoop Job完成Hive與MySQL間的數據遷移
    9.2.1  Sqoop Job
    9.2.2  技能實訓
  本章小結
  本章作業
第10章  項目實訓:電子商務消費行為分析
  10.1  項目準備
  10.2  難點分析
  10.3  項目實現思路
  本章小結
  本章作業

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032