幫助中心 | 我的帳號 | 關於我們

實時分析實戰(構建實時流處理應用和分析系統)

  • 作者:(英)馬克·尼達姆|責編:王春華//趙亮宇|譯者:盧健//王同林//曹洪偉
  • 出版社:機械工業
  • ISBN:9787111759805
  • 出版日期:2024/08/01
  • 裝幀:平裝
  • 頁數:202
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書為想要設計、構建和維護實時分析應用程序的人員(包括數據工程師、架構師和技術領導者)提供了結構合理的基礎知識。第1章和第2章簡要介紹實時分析,並概述可以構建的實時分析應用程序的類型。第3章介紹一家虛構的比薩公司,該公司已經建立了流處理基礎設施,但尚未實現任何實時分析功能。第4?10章展示如何為這家比薩公司實現不同類型的實時分析應用程序。第11?13章介紹將應用程序投入生產時的注意事項、實時分析的一些真實使用案例,以及未來幾年該領域可能會出現的情況。

作者介紹
(英)馬克·尼達姆|責編:王春華//趙亮宇|譯者:盧健//王同林//曹洪偉
    馬克·尼達姆(Mark Needham),Neo4j公司開發者關係工程師,Neo4j認證專家,曾深度參與Neo4j因果集群的開發工作。馬克致力於幫助客戶運用圖資料庫,善於針對富有挑戰性的數據問題構建綜合的解決方案。

目錄

前言
第1章  實時分析簡介
  1.1  什麼是事件流
  1.2  理解流數據
  1.3  什麼是實時分析
  1.4  實時分析的優勢
    1.4.1  新的收入來源
    1.4.2  及時洞察客戶
    1.4.3  降低基礎設施成本
    1.4.4  改善整體客戶體驗
  1.5  實時分析用例
    1.5.1  面向用戶的分析
    1.5.2  個性化
    1.5.3  指標
    1.5.4  異常檢測和根本原因分析
    1.5.5  可視化
    1.5.6  即時分析
    1.5.7  日誌分析/文本搜索
  1.6  對實時分析應用程序進行分類
    1.6.1  面向內部與面向外部
    1.6.2  面向機器與面向人類
  1.7  本章小結
第2章  實時分析生態系統
  2.1  定義實時分析生態系統
  2.2  經典流處理技術棧
    2.2.1  複雜事件處理
    2.2.2  大數據時代
  2.3  現代流處理技術棧
    2.3.1  事件生成器
    2.3.2  流處理數據平台
    2.3.3  流處理層
    2.3.4  服務層
    2.3.5  前端
  2.4  本章小結
第3章  介紹AATD:比薩外賣店的實時分析
  3.1  現有架構
  3.2  設置
    3.2.1  MySQL
    3.2.2  Apache Kafka
    3.2.3  ZooKeeper
    3.2.4  訂單服務
    3.2.5  啟動組件
  3.3  檢查數據
  3.4  實時分析的應用
  3.5  本章小結
第4章  使用Kafka Streams進行查詢
  4.1  什麼是Kafka Streams
  4.2  什麼是Quarkus
  4.3  Quarkus應用程序

    4.3.1  安裝Quarkus CLI
    4.3.2  創建Quarkus應用程序
    4.3.3  創建拓撲結構
    4.3.4  查詢鍵值存儲
    4.3.5  創建HTTP端點
  4.4  運行應用程序
  4.5  查詢HTTP端點
  4.6  Kafka Streams的局限性
  4.7  本章小結
第5章  服務層—Apache Pinot
  5.1  為什麼不能使用其他流處理器
  5.2  為什麼不能使用數據倉庫
  5.3  什麼是Apache Pinot
  5.4  Pinot如何對數據進行建模和存儲
    5.4.1  數據模式
    5.4.2  表
  5.5  配置
  5.6  數據攝取
  5.7   Pinot數據瀏覽器
  5.8  索引
  5.9  更新Web應用程序
  5.10  本章小結
第6章  構建實時分析儀錶盤
  6.1  儀錶盤架構
  6.2  什麼是Streamlit
  6.3  配置
  6.4  構建儀錶盤
  6.5  本章小結
第7章  通過CDC獲取產品變化
  7.1  從業務資料庫獲取更改信息
  7.2  CDC
    7.2.1  為什麼需要CDC
    7.2.2  什麼是CDC
    7.2.3  實施CDC的策略
    7.2.4  基於日誌的數據採集
    7.2.5  CDC系統的需求
    7.2.6  Debezium
  7.3  將CDC應用於AATD
    7.3.1  配置
    7.3.2  將Debezium連接到MySQL
    7.3.3  查詢商品數據流
    7.3.4  更新產品
  7.4  本章小結
第 8 章  使用Kafka Streams連接流
  8.1  使用Kafka Streams豐富訂單數據
  8.2  將訂單項添加到Pinot
  8.3  更新訂單服務信息
  8.4  刷新Streamlit儀錶盤
  8.5  本章小結
第9章  服務層的插入更新

  9.1  訂單狀態
  9.2  豐富訂單流信息
  9.3  Apache Pinot的插入更新
  9.4  更新訂單服務
    9.4.1  創建用戶資源文件
    9.4.2  添加一個所有用戶的端點
    9.4.3  為用戶端點添加訂單
    9.4.4  添加單個訂單端點
    9.4.5  實現跨資源共享
  9.5  前端應用程序
  9.6  儀錶盤上的訂單狀態
    9.6.1  每個訂單狀態的耗時
    9.6.2  可能被延誤的訂單
  9.7  本章小結
第10章  地理空間查詢
  10.1  交付狀態
  10.2  更新Apache Pinot
    10.2.1  訂單
    10.2.2  交付狀態
  10.3  更新訂單服務
    10.3.1  個人訂單
    10.3.2  按地區劃分的延遲訂單
    10.3.3  使用新的API端點
  10.4  本章小結
第11章  生產環境中的注意事項
  11.1  前期準備
    11.1.1  容量規劃
    11.1.2  數據分區
    11.1.3  吞吐量
    11.1.4  數據保留
    11.1.5  數據粒度
    11.1.6  總數據大小
    11.1.7  複製因子
  11.2  部署平台
    11.2.1  自身技能
    11.2.2  數據隱私和安全
    11.2.3  成本
    11.2.4  控制
  11.3  後期管理
    11.3.1  監控和報警
    11.3.2  數據治理
  11.4  本章小結
第12章  現實世界中的實時分析
  12.1  內容推薦(專業社交網路)
    12.1.1  問題
    12.1.2  解決方案
    12.1.3  收益
  12.2  運營分析(流媒體服務)
    12.2.1  問題
    12.2.2  解決方案

    12.2.3  收益
  12.3  實時廣告分析(網上商城)
    12.3.1  問題
    12.3.2  解決方案
    12.3.3  收益
  12.4  面向用戶的分析(協作平台)
    12.4.1  問題
    12.4.2  解決方案
    12.4.3  收益
  12.5  本章小結
第13章  實時分析的未來
  13.1  邊緣分析
  13.2  計算存儲分離
  13.3  湖倉一體
  13.4  實時數據可視化
  13.5  流式資料庫
  13.6  流數據平台即服務
  13.7  反向ETL
  13.8  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032