幫助中心 | 我的帳號 | 關於我們

ClickHouse性能之巔(從架構設計解讀性能之謎)/資料庫技術叢書

  • 作者:陳峰|責編:韓蕊
  • 出版社:機械工業
  • ISBN:9787111716587
  • 出版日期:2023/01/01
  • 裝幀:平裝
  • 頁數:177
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    這是一本通過分析ClickHouse底層引擎架構來解讀ClickHouse極致性能的底層邏輯的著作,同時還總結了ClickHouse在各種適用場景中的使用技巧和性能調優方法,讓讀者知其然,也能知其所以然。
    全書一共12章,分為兩個部分:
    第1部分架構篇(第1-7章)
    簡要地介紹了數據倉庫的核心技術和思路,系統講解了ClickHouse的查詢性能優勢、適用場景、架構設計和運作過程,深入地剖析了ClickHouse的存儲引擎架構、計算引擎架構以及決定ClickHouse性能的關鍵因素,還將ClickHouse與其他數倉架構進行了深度對比,不僅闡明了ClickHouse查詢速度快的底層邏輯,也推導出了ClickHouse的適用場景。
    第2部分實戰篇(第8-12章)
    針對ClickHouse的適用場景,講解了它的各種使用技巧以及存算分離架構、分散式架構等雲計算時代的全新架構,更重要的是,從數據結構、內存、磁碟、網路、CPU、查詢等方面全面總結了ClickHouse的性能優化方法和原則。

作者介紹
陳峰|責編:韓蕊
    陳峰     資深大數據專家和架構師,ClickHouse技術專家,滴普科技(湖倉一體數據智能基礎軟體獨角獸)首席架構師,從0到1地建設了首支滴普科技的數據技術團隊,構建了滴普科技的數據技術體系。     有多年的大數據架構經驗,曾擔任百麗數據中台麗影洞察項目的大數據架構師,將ClickHouse 成功引入百麗。     曾在中國資料庫技術大會(DatabaseTechnology Conference China, DTCC)等多個會議上發表ClickHouse 主題演講,對ClickHouse有非常深入的研究,實踐經驗豐富。     積极參与ClickHouse社區活動,積極推廣ClickHouse。在多個項目中應用ClickHouse技術,將ClickHouse的強大能力推廣到企業中,同時積極地向ClickHouse社區貢獻代碼和開源工具。

目錄
讚譽


自序
前言
第一部分 架構篇
第1章  數據倉庫的核心技術 
  1.1  OLAP和OLTP的本質區別 
    1.1.1  數據三範式 
    1.1.2  規範化的意義 
    1.1.3  規範化的局限 
    1.1.4  數倉建模的本質 
    1.1.5  OLAP和OLTP的底層數據模型 
    1.1.6  維度建模 
  1.2  典型大數據數倉技術及其核心思路 
    1.2.1  Hive 
    1.2.2  HBase 
    1.2.3  Kylin 
    1.2.4  其他數倉 
  1.3  傳統數倉的缺陷 
    1.3.1  效率低 
    1.3.2  延遲高 
    1.3.3  成本高 
  1.4  ClickHouse查詢性能的優勢 
    1.4.1  向量化引擎 
    1.4.2  高效的數據壓縮 
    1.4.3  高效的I/O優化 
  1.5  本章小結 
第2章  ClickHouse簡介 
  2.1  ClickHouse的4個標籤 
    2.1.1  性能強大 
    2.1.2  單機處理能力強 
    2.1.3  成本低 
    2.1.4  不支持事務 
  2.2  ClickHouse的3個適用場景 
    2.2.1  BI報表的互動式分析 
    2.2.2  互聯網日誌分析 
    2.2.3  廣告營銷 
  2.3  本章小結 
第3章  ClickHouse架構概覽 
  3.1  ClickHouse架構簡介 
  3.2  ClickHouse的核心抽象 
    3.2.1  列和欄位 
    3.2.2  數據類型 
    3.2.3  塊 
    3.2.4  表 
  3.3  ClickHouse的運作過程 
    3.3.1  數據插入過程 
    3.3.2  數據查詢過程 
    3.3.3  數據更新和數據刪除過程 

  3.4  本章小結 
第4章  MergeTree存儲引擎架構 
  4.1  MergeTree存儲引擎的三大特點 
  4.2  MergeTree的數據組織 
    4.2.1  塊 
    4.2.2  數據堆放方式 
  4.3  MergeTree的文件組織 
    4.3.1  數據文件、元數據文件、索引文件和其他文件 
    4.3.2  分區 
    4.3.3  資料庫和表 
  4.4  索引 
    4.4.1  主鍵索引 
    4.4.2  標記 
  4.5  與事務資料庫存儲引擎的對比 
  4.6  存儲引擎如何影響查詢速度 
    4.6.1  預排序 
    4.6.2  列存 
    4.6.3  壓縮 
  4.7  MergeTree存儲引擎的工作過程 
    4.7.1  資料庫、數據表的創建過程 
    4.7.2  數據插入過程 
    4.7.3  分區合併和刪除過程 
    4.7.4  數據讀取過程 
  4.8  本章小結 
第5章  ClickHouse計算引擎架構 
  5.1  ClickHouse計算引擎的架構簡介與設計思想 
    5.1.1  整體架構 
    5.1.2  SQL解析器 
    5.1.3  解釋器 
    5.1.4  執行器 
    5.1.5  設計思想 
  5.2  火山模型 
    5.2.1  火山模型概述 
    5.2.2  火山模型的原理 
    5.2.3  火山模型的優點與缺點 
  5.3  向量化引擎 
    5.3.1  向量化引擎的實現方式 
    5.3.2  ClickHouse中的向量化運算元 
    5.3.3  向量化引擎的前提 
  5.4  計算引擎如何影響查詢速度 
    5.4.1  ClickHouse查詢速度快的前提 
    5.4.2  ClickHouse查詢速度快的本質 
  5.5  本章小結 
第6章  ClickHouse與其他數倉架構的對比 
  6.1  ClickHouse與Hive的對比 
    6.1.1  Hive的數據文件 
    6.1.2  Hive的存儲系統 
    6.1.3  Hive計算引擎與ClickHouse計算引擎的差異 
    6.1.4  ClickHouse比Hive查詢速度快的原因 
  6.2  ClickHouse與HBase的對比 

    6.2.1  HBase的數據模型 
    6.2.2  HBase的存儲系統與ClickHouse的異同 
    6.2.3  HBase的適用場景及ClickHouse不適合的原因 
  6.3  ClickHouse與Kylin的對比 
    6.3.1  Kylin的架構 
    6.3.2  Kylin解決性能問題的思路 
    6.3.3  Kylin方案的缺陷 
    6.3.4  ClickHouse的方案 
  6.4  本章小結 
第7章  深度思考:決定外在能力的因素 
  7.1  從架構層面分析ClickHouse 
    7.1.1  ClickHouse速度快的前提 
    7.1.2  對ClickHouse的一些誤解 
  7.2  結構決定功能 
    7.2.1  方法論 
    7.2.2  意義 
    7.2.3  不要過度設計 
  7.3  從ClickHouse的設計來理解 
    7.3.1  結構決定能力的上限 
    7.3.2  結構決定應用層演算法 
  7.4  本章小結 
第二部分 實戰篇
第8章  ClickHouse使用技巧 
  8.1  數據導入、導出技巧 
    8.1.1  外部文件導入、導出技巧 
    8.1.2  靈活使用集成表引擎導入、導出數據 
  8.2  建表技巧 
    8.2.1  表引擎選擇技巧 
    8.2.2  分區鍵選擇技巧 
    8.2.3  數據結構選擇技巧 
    8.2.4  分區技巧 
  8.3  高級技巧 
    8.3.1  物化視圖 
    8.3.2  投影 
    8.3.3  點陣圖 
    8.3.4  變更數據捕獲 
  8.4  常見報錯及處理方法 
  8.5  本章小結 
第9章  ClickHouse實現用戶畫像系統 
  9.1  用戶畫像概述 
    9.1.1  用戶畫像系統介紹 
    9.1.2  用戶畫像系統的需求描述 
    9.1.3  用戶畫像系統的需求分析 
    9.1.4  用戶畫像系統的架構 
  9.2  用戶畫像系統的關鍵技術實現 
    9.2.1  技術選型 
    9.2.2  分析階段 
    9.2.3  運營階段 
  9.3  基於ClickHouse的用戶畫像系統的優點 
  9.4  本章小結 

第10章  ClickHouse的存算分離架構 
  10.1  存算分離架構背景 
    10.1.1  相關概述 
    10.1.2  存算分離的典型架構 
    10.1.3  存算分離的意義 
    10.1.4  存算分離的局限 
  10.2  ClickHouse中的存算分離 
    10.2.1  實現方式 
    10.2.2  注意事項 
  10.3  存算分離架構給ClickHouse帶來的優勢 
  10.4  本章小結 
第11章  ClickHouse的分散式架構 
  11.1  架構特點及對比 
    11.1.1  ClickHouse分散式架構的優點 
    11.1.2  ClickHouse分散式架構的缺點 
    11.1.3  ClickHouse與Hadoop的分散式架構對比 
  11.2  基本概念 
    11.2.1  集群 
    11.2.2  副本 
    11.2.3  分片 
  11.3  ClickHouse的複製表引擎 
    11.3.1  創建複製表 
    11.3.2  複製表複製 
    11.3.3  複製表查詢 
  11.4  ClickHouse分散式表引擎 
    11.4.1  創建分散式表 
    11.4.2  分散式表查詢原理 
    11.4.3  分散式表的數據寫入方案 
    11.4.4  分散式表中副本的處理方式 
  11.5  本章小結 
第12章  ClickHouse性能優化 
  12.1  性能優化的原則 
  12.2  數據結構優化 
  12.3  內存優化 
  12.4  磁碟優化 
  12.5  網路優化 
  12.6  CPU優化 
  12.7  查詢優化 
  12.8  數據遷移優化 
  12.9  本章小結 

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032