幫助中心 | 我的帳號 | 關於我們

Hive實戰/圖靈程序設計叢書

  • 作者:(美)斯科特·肖//(南非)安德烈亞斯·弗朗索瓦·弗穆爾恩//(印)安庫爾·古普塔//(美)戴維·傑魯姆加德|譯者:唐富年
  • 出版社:人民郵電
  • ISBN:9787115493910
  • 出版日期:2018/11/01
  • 裝幀:平裝
  • 頁數:238
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    Hive「出身名門」,是最初由Facebook公司開發的數據倉庫工具。它簡單且容易上手,是深入學習Hadoop技術的一個很好的切入點。斯科特·肖,安德烈亞斯·弗朗索瓦·弗穆爾恩,安庫爾·古普塔,戴維·傑魯姆加德著的《Hive實戰》由資料庫專家和大數據專家共同撰寫,具體內容包括:Hive的安裝和配置,其核心組件和架構,Hive數據操作語言,如何載入、查詢和分析數據,Hive的性能調優以及安全性,等等。本書旨在為讀者打牢基礎,從而踏上專業的大數據處理之旅。
    本書面向數據科學家以及對大數據技術感興趣的讀者。

作者介紹
(美)斯科特·肖//(南非)安德烈亞斯·弗朗索瓦·弗穆爾恩//(印)安庫爾·古普塔//(美)戴維·傑魯姆加德|譯者:唐富年

目錄
第1章  為Hive打好基礎:Hadoop
  1.1  一隻小象出生了
  1.2  Hadoop的結構
  1.3  數據冗余
    1.3.1  傳統的高可用性
    1.3.2  Hadoop的高可用性
  1.4  MapReduce處理
    1.4.1  超越MapReduce
    1.4.2  YARN和現代數據架構
    1.4.3  Hadoop和開源社區
    1.4.4  我們身在何處
第2章  Hive簡介
  2.1  Hadoop發行版
  2.2  集群架構
  2.3  Hive的安裝
  2.4  探尋你的方式
  2.5  HiveCLI
第3章  Hive架構
  3.1  Hive組件
  3.2  HCatalog
  3.3  HiveServer2
  3.4  客戶端工具
  3.5  執行引擎:Tez
第4章  Hive表DDL
  4.1  schema-on-read
  4.2  Hive數據模型
    4.2.1  模式/資料庫
    4.2.2  為什麼使用多個模式/資料庫
    4.2.3  創建資料庫
    4.2.4  更改資料庫
    4.2.5  刪除資料庫
    4.2.6  列出資料庫
  4.3  Hive中的數據類型
    4.3.1  基本數據類型
    4.3.2  選擇數據類型
    4.3.3  複雜數據類型
  4.4  表
    4.4.1  創建表
    4.4.2  列出表
    4.4.3  內部表/外部表
    4.4.4  內部表/受控表
    4.4.5  內部表/外部表示例
    4.4.6  表的屬性
    4.4.7  生成已有表的CREATETABLE命令
    4.4.8  分區和分桶
    4.4.9  分區注意事項
    4.4.10  對日期列進行高效分區
    4.4.11  分桶的注意事項
    4.4.12  更改表
    4.4.13  ORC文件格式

    4.4.14  更改表分區
    4.4.15  修改列
    4.4.16  刪除表/分區
    4.4.17  保護表/分區
    4.4.18  其他CREATETABLE命令選項
第5章  數據操作語言
  5.1  將數據裝載到表中
    5.1.1  使用存儲在HDFS中的文件裝載數據
    5.1.2  使用查詢裝載數據
    5.1.3  將查詢到的數據寫入文件系統
    5.1.4  直接向表插入值
    5.1.5  直接更新表中數據
    5.1.6  在表中直接刪除數據
    5.1.7  創建結構相同的表
  5.2  連接
    5.2.1  使用等值連接來整合表
    5.2.2  使用外連接
    5.2.3  使用左半連接
    5.2.4  用單次MapReduce實現連接
    5.2.5  最後使用最大的表
    5.2.6  事務處理
    5.2.7  ACID是什麼,以及為什麼要用到它
    5.2.8  Hive配置
第6章  將數據裝載到Hive
  6.1  裝載數據之前的設計注意事項
  6.2  將數據裝載到HDFS
    6.2.1  Ambari文件視圖
    6.2.2  Hadoop命令行
    6.2.3  HDFS的NFSGateway
    6.2.4  Sqoop
    6.2.5  ApacheNiFi
  6.3  用Hive訪問數據
    6.3.1  外部表
    6.3.2  LOADDATA語句
  6.4  在Hive中裝載增量變更數據
  6.5  Hive流處理
  6.6  小結
第7章  查詢半結構化數據
  7.1  點擊流數據
    7.1.1  攝取數據
    7.1.2  創建模式
    7.1.3  裝載數據
    7.1.4  查詢數據
  7.2  攝取JSON數據
    7.2.1  使用UDF查詢JSON
    7.2.2  使用SerDe訪問JSON
第8章  Hive分析
  8.1  構建分析模型
    8.1.1  使用太陽模型獲取需求
    8.1.2  將太陽模型轉換為星型模式

    8.1.3  構建數據倉庫
  8.2  評估分析模型.
    8.2.1  評估太陽模型
    8.2.2  評估聚合結果
    8.2.3  評估數據集市
  8.3  掌握數據倉庫管理
    8.3.1  必備條件
    8.3.2  檢索資料庫
    8.3.3  評估資料庫
    8.3.4  過程資料庫
    8.3.5  轉換資料庫
    8.3.6  你掌握了什麼
    8.3.7  組織資料庫
    8.3.8  報表資料庫
    8.3.9  示例報表
  8.4  高級分析
  8.5  接下來學什麼
第9章  Hive性能調優
  9.1  Hive性能檢查表
  9.2  執行引擎
    9.2.1  MapReduce
    9.2.2  Tez
  9.3  存儲格式
    9.3.1  ORC格式
    9.3.2  Parquet格式
  9.4  矢量化查詢執行
  9.5  查詢執行計劃
    9.5.1  基於代價的優化
    9.5.2  執行計劃
    9.5.3  性能檢查表小結
第10章  Hive的安全性
  10.1  數據安全性的幾個方面
    10.1.1  身份認證
    10.1.2  授權
    10.1.3  管理
    10.1.4  審計
    10.1.5  數據保護
  10.2  Hadoop的安全性
  10.3  Hive的安全性
    10.3.1  默認授權模式
    10.3.2  基於存儲的授權模式
    10.3.3  基於SQL標準的授權模式
    10.3.4  管理通過SQL進行的訪問
  10.4  使用Ranger進行Hive授權
    10.4.1  訪問Ranger用戶界面
    10.4.2  創建Ranger策略
    10.4.3  使用Ranger審計
第11章  Hive的未來
  11.1  LLAP
  11.2  Hive-on-Spark

  11.3  Hive:ACID和MERGE
  11.4  可調隔離等級
  11.5  ROLAP/基於立方體的分析
  11.6  HiveServer2的發展
  11.7  面向不同工作負載的多個HiveServer2實例
附錄A  建立大數據團隊
附錄B  Hive函數

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032