幫助中心 | 我的帳號 | 關於我們

雲數據湖(構建健壯的雲數據架構)

  • 作者:(美)魯克米尼·戈帕蘭|責編:王春華|譯者:張燕妮
  • 出版社:機械工業
  • ISBN:9787111762751
  • 出版日期:2024/09/01
  • 裝幀:平裝
  • 頁數:200
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書詳細介紹了可用於數據處理的表格格式、雲產品、框架、存儲層,以及如何將這些內容組合在一起,以獲得適合自己需求的高性能解決方案。作者在書中提供的決策框架將幫助你明智地決定選擇哪種數據湖。本書是大數據領域每個人的必讀書。閱讀本書後,你將了解構建雲數據湖所需的所有基礎知識,並能夠以多種方式應用這些知識。本書主要面向數據架構師、數據開發人員和數據運維專業人員,他們希望廣泛地了解設置和運營雲數據湖的各個方面。

作者介紹
(美)魯克米尼·戈帕蘭|責編:王春華|譯者:張燕妮
    魯克米尼·戈帕蘭,是一位產品管理領導者,曾在微軟和其他初創公司從事數據基礎設施和平台方面的工作。她的目標是向數據架構師和數據開發人員傳授構建雲數據湖平台的各方面知識。她住在華盛頓州的雷德蒙德,喜歡探索太平洋西北地區,交談時喜歡喝咖啡。

目錄
前言
第1章  大數據—超越喧囂
  1.1  什麼是大數據
  1.2  彈性數據基礎設施的挑戰
  1.3  雲計算基礎
    1.3.1  雲計算術語
    1.3.2  雲的價值主張
  1.4  雲數據湖架構
    1.4.1  本地數據倉庫解決方案的限制
    1.4.2  什麼是雲數據湖架構
    1.4.3  雲數據湖架構的優勢
  1.5  開啟雲數據湖之旅
  1.6  總結
第2章  雲上的大數據架構
  2.1  為什麼Klodars公司要遷移到雲
  2.2  雲數據湖架構基礎
    2.2.1  淺談數據的多樣性
    2.2.2  雲數據湖存儲
    2.2.3  大數據分析引擎
    2.2.4  雲數據倉庫
  2.3  現代數據倉庫架構
    2.3.1  參考架構
    2.3.2  現代數據倉庫架構的用例
    2.3.3  現代數據倉庫架構的優勢和挑戰
  2.4  數據湖倉一體架構
    2.4.1  參考架構
    2.4.2  數據湖倉一體架構的用例
    2.4.3  數據湖倉一體架構的優勢和挑戰
    2.4.4  數據倉庫和非結構化數據
  2.5  數據網格
    2.5.1  參考架構
    2.5.2  數據網格架構的用例
    2.5.3  數據網格架構的優勢和挑戰
  2.6  什麼是適合的架構
    2.6.1  了解客戶
    2.6.2  了解業務驅動因素
    2.6.3  考慮增長和未來場景
    2.6.4  設計注意事項
    2.6.5  混合方法
  2.7  總結
第3章  數據湖的設計注意事項
  3.1  設置雲數據湖基礎設施
    3.1.1  確定目標
    3.1.2  規劃架構和可交付成果
    3.1.3  雲數據湖實施
    3.1.4  發布和運行
  3.2  在數據湖中組織數據
    3.2.1  數據生命中的一天
    3.2.2  數據湖區
    3.2.3  組織機制

  3.3  數據治理簡介
    3.3.1  數據治理的參與者
    3.3.2  數據分類
    3.3.3  元數據管理、數據目錄和數據共享
    3.3.4  數據訪問管理
    3.3.5  數據質量和可觀測性
    3.3.6  Klodars公司的數據治理
    3.3.7  數據治理總結
  3.4  管理數據湖成本
    3.4.1  揭秘雲上的數據湖成本
    3.4.2  數據湖成本策略
  3.5  總結
第4章  可擴展的數據湖
  4.1  可擴展性探秘
    4.1.1  什麼是可擴展性
    4.1.2  日常生活中的規模
    4.1.3  數據湖架構中的可擴展性
  4.2  數據湖處理系統的內部
    4.2.1  內部數據複製
    4.2.2  內部ELT/ETL處理
    4.2.3  關於其他互動式查詢的說明
  4.3  可擴展數據湖解決方案的注意事項
    4.3.1  選擇合適的雲產品
    4.3.2  峰值容量規劃
    4.3.3  數據格式和作業配置文件
  4.4  總結
第5章  優化雲數據湖架構以提高性能
  5.1  度量性能的基礎知識
    5.1.1  性能的目標和指標
    5.1.2  度量性能
    5.1.3  優化以提高性能
  5.2  雲數據湖性能
    5.2.1  SLA、SLO和SLI
    5.2.2  示例:Klodars公司如何管理其SLA、SLO和SLI
  5.3  性能驅動因素
    5.3.1  複製作業的性能驅動因素
    5.3.2  Spark作業的性能驅動因素
  5.4  性能調優的優化原則和技術
    5.4.1  數據格式
    5.4.2  數據組織和分區
    5.4.3  在Apache Spark上選擇正確的配置
  5.5  減少數據傳輸開銷
  5.6  優質產品和性能
    5.6.1  大型虛擬機案例
    5.6.2  快閃記憶體案例
  5.7  總結
第6章  深入了解數據格式
  6.1  為什麼我們需要這些開放數據格式
    6.1.1  為什麼我們需要存儲表格數據
    6.1.2  為什麼在雲數據湖中存儲表格數據是一個問題

  6.2  Delta Lake
    6.2.1  為什麼開發Delta Lake
    6.2.2  Delta Lake如何工作
    6.2.3  什麼時候使用Delta Lake
  6.3  Apache Iceberg
    6.3.1  為什麼開發Apache Iceberg
    6.3.2  Apache Iceberg是如何工作的
    6.3.3  什麼時候使用Apache Iceberg
  6.4  Apache Hudi
    6.4.1  為什麼孵化Apache Hudi
    6.4.2  Apache Hudi如何工作
    6.4.3  什麼時候使用Apache Hudi
  6.5  總結
第7章  架構的決策框架
  7.1  雲數據湖評估
  7.2  雲數據湖評估分析
    7.2.1  從零開始
    7.2.2  將現有數據湖或數據倉庫遷移到雲
    7.2.3  改進現有的雲數據湖
  7.3  決策框架的第1階段:評估
    7.3.1  了解客戶需求
    7.3.2  了解改進的機會
    7.3.3  了解業務驅動因素
    7.3.4  確定需求的優先順序來完成評估階段
  7.4  決策框架的第2階段:定義
    7.4.1  確定雲數據湖的設計選擇
    7.4.2  規劃雲數據湖項目可交付成果
  7.5  決策框架的第3階段:實施
  7.6  決策框架的第4階段:操作
  7.7  總結
第8章  數據啟迪未來的六大經驗
  8.1  第1課:關注云數據湖的工作方式和時間,而不是「如果」和「為什麼」
  8.2  第2課:權力越大,責任越大—數據也不例外
  8.3  第3課:客戶引領技術,而不是技術引領客戶
  8.4  第4課:改變是不可避免的,所以要做好準備
  8.5  第5課:建立同理心,分清輕重緩急
  8.6  第6課:巨大的影響不會在一夜之間發生
  8.7  總結
附錄  雲數據湖決策框架模板

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032