幫助中心 | 我的帳號 | 關於我們

劍指大數據(Flink學習精要Scala版)/程序員硬核技術叢書

  • 作者:編者:尚矽谷教育|責編:李冰
  • 出版社:電子工業
  • ISBN:9787121443428
  • 出版日期:2022/10/01
  • 裝幀:平裝
  • 頁數:300
人民幣:RMB 105 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書基於流行穩定版Flink 1.13進行講解,從Flink數據處理思想開始講起,帶領讀者深入理解Flink的基本架構,進而由淺入深結合具體案例進行講解,詳細剖析了Flink中DataStream API的使用,並對Flink中的時間語義、狀態、容錯機制等重要概念進行了詳盡的闡釋。同時,本書還對實際開發過程中常用的Flink SQL、CEP等高層級API進行了細緻講解,以電商網站中的實際應用為場景,提供了大量的代碼實現。
    本書分為12章:第1?5章,帶領讀者初步認識Flink並編寫基本的Flink程序;第6?10章,深入探討了Flink內部的高級應用。第11?12章,講解了Flink提供的擴展功能。
    本書適用於大數據的學習者與從業人員,以及院校大數據相關專業的學生,也是大數據學習的必備書籍。

作者介紹
編者:尚矽谷教育|責編:李冰

目錄
第1章  初識Flink
  1.1  Flink的起源和設計理念
  1.2  Flink的應用
    1.2.1  Flink在企業中的應用
    1.2.2  Flink主要的應用場景
  1.3  流式數據處理的發展和演變
    1.3.1  流處理和批處理
    1.3.2  傳統事務處理
    1.3.3  有狀態的流處理
    1.3.4  Lambda架構
    1.3.5  新一代流處理器
  1.4  Flink的特性總結
    1.4.1  Flink的核心特性
    1.4.2  分層API
  1.5  Flink與Spark
    1.5.1  數據處理架構
    1.5.2  數據模型和運行架構
    1.5.3  Spark還是Flink
  1.6  本章總結
第2章  Flink快速上手
  2.1  環境準備
  2.2  創建項目
  2.3  編寫代碼
    2.3.1  批處理
    2.3.2  流處理
  2.4  本章總結
第3章  Flink部署
  3.1  快速啟動一個Flink集群
    3.1.1  環境配置
    3.1.2  本地啟動
    3.1.3  集群啟動
    3.1.4  向集群提交作業
  3.2  部署模式
    3.2.1  會話模式
    3.2.2  單作業模式
    3.2.3  應用模式
  3.3  獨立模式
    3.3.1  會話模式部署
    3.3.2  單作業模式部署
    3.3.3  應用模式部署
    3.3.4  高可用
  3.4  YARN模式
    3.4.1  相關準備和配置
    3.4.2  會話模式部署
    3.4.3  單作業模式部署
    3.4.4  應用模式部署
    3.4.5  高可用
  3.5  K8s模式
  3.6  本章總結
第4章  Flink運行時架構

  4.1  系統架構
    4.1.1  整體構成
    4.1.2  JobManager
    4.1.3  TaskManager
  4.2  作業提交流程
    4.2.1  高層級抽象視角
    4.2.2  獨立模式
    4.2.3  YARN集群
  4.3  一些重要概念
    4.3.1  數據流圖
    4.3.2  並行度
    4.3.3  運算元鏈
    4.3.4  作業圖與執行圖
    4.3.5  任務和任務槽
  4.4  本章總結
第5章  DataStreamAPI基礎篇
  5.1  執行環境
    5.1.1  創建執行環境
    5.1.2  執行模式
    5.1.3  觸發程序執行
  5.2  數據源
    5.2.1  準備工作
    5.2.2  從集合中讀取數據
    5.2.3  從文件讀取數據
    5.2.4  從Socket讀取數據
    5.2.5  從Kafka讀取數據
    5.2.6  自定義數據源
    5.2.7  Flink支持的數據類型
  5.3  轉換操作
    5.3.1  基本轉換運算元
    5.3.2  聚合運算元
    5.3.3  用戶自定義函數
    5.3.4  物理分區
  5.4  輸出
    5.4.1  連接到外部系統
    5.4.2  輸出到文件
    5.4.3  輸出到Kafka
    5.4.4  輸出到Redis
    5.4.5  輸出到Elasticsearch
    5.4.6  輸出到MySQL
    5.4.7  自定義Sink輸出
  5.5  本章總結
第6章  Flink中的時間和窗口
  6.1  時間語義
    6.1.1  Flink中的時間語義
    6.1.2  哪種時間語義更重要
  6.2  水位線
    6.2.1  事件時間和窗口
    6.2.2  什麼是水位線
    6.2.3  如何生成水位線

    6.2.4  水位線的傳遞
    6.2.5  水位線的總結
  6.3  窗口
    6.3.1  窗口的概念
    6.3.2  窗口的分類
    6.3.3  窗口API概覽
    6.3.4  窗口分配器
    6.3.5  窗口函數
    6.3.6  測試水位線和窗口的使用
    6.3.7  其他API
    6.3.8  窗口的生命周期
  6.4  遲到數據的處理
    6.4.1  設置水位線延遲時間
    6.4.2  允許窗口處理遲到數據
    6.4.3  將遲到數據放入窗口側輸出流
  6.5  本章總結
第7章  處理函數
  7.1  基本處理函數
    7.1.1  處理函數的功能和使用
    7.1.2  ProcessFunction解析
    7.1.3  處理函數的分類
  7.2  按鍵分區處理函數
    7.2.1  定時器和定時服務
    7.2.2  KeyedProcessFunction的使用
  7.3  窗口處理函數
    7.3.1  窗口處理函數的使用
    7.3.2  ProcessWindowFunction解析
  7.4  應用案例??TopN
    7.4.1  使用ProcessAllWindowFunction
    7.4.2  使用KeyedProcessFunction
  7.5  側輸出流
  7.6  本章總結
第8章  多流轉換
  8.1  分流
    8.1.1  簡單實現
    8.1.2  使用側輸出流
  8.2  基本合流操作
    8.2.1  聯合
    8.2.2  連接
  8.3  基於時間的合流??聯結
    8.3.1  窗口聯結
    8.3.2  間隔聯結
    8.3.3  窗口同組聯結
  8.4  本章總結
第9章  狀態編程
  9.1  Flink中的狀態
    9.1.1  有狀態運算元
    9.1.2  狀態的管理
    9.1.3  狀態的分類
  9.2  按鍵分區狀態

    9.2.1  基本概念和特點
    9.2.2  支持的結構類型
    9.2.3  代碼實現
    9.2.4  狀態生存時間
  9.3  運算元狀態
    9.3.1  基本概念和特點
    9.3.2  狀態類型
    9.3.3  代碼實現
  9.4  廣播狀態
    9.4.1  基本用法
    9.4.2  代碼實例
  9.5  狀態持久化和狀態後端
    9.5.1  檢查點
    9.5.2  狀態後端
  9.6  本章總結
第10章  容錯機制
  10.1  檢查點
    10.1.1  檢查點的保存
    10.1.2  從檢查點恢復狀態
    10.1.3  檢查點演算法
    10.1.4  檢查點配置
    10.1.5  保存點
  10.2  狀態一致性
    10.2.1  一致性的概念和級別
    10.2.2  端到端的狀態一致性
  10.3  端到端精確一次
    10.3.1  輸入端保證
    10.3.2  輸出端保證
    10.3.3  Flink和Kafka連接時的精確一次保證
  10.4  本章總結
第11章  TableAPI和SQL
  11.1  快速上手
    11.1.1  需要引入的依賴
    11.1.2  一個簡單示例
  11.2  基本API
    11.2.1  程序架構
    11.2.2  創建表環境
    11.2.3  創建表
    11.2.4  表的查詢
    11.2.5  輸出表
    11.2.6  表和流的轉換
  11.3  流處理中的表
    11.3.1  動態表和持續查詢
    11.3.2  將流轉換成動態表
    11.3.3  用SQL持續查詢
    11.3.4  將動態表轉換為流
  11.4  時間屬性和窗口
    11.4.1  事件時間
    11.4.2  處理時間
    11.4.3  窗口

  11.5  聚合查詢
    11.5.1  分組聚合
    11.5.2  窗口聚合
    11.5.3  開窗聚合
    11.5.4  應用實例??TopN
  11.6  聯結查詢
    11.6.1  常規聯結查詢
    11.6.2  間隔聯結查詢
  11.7  函數
    11.7.1  系統函數
    11.7.2  自定義函數
  11.8  SQL客戶端
  11.9  連接到外部系統
    11.9.1  Kafka
    11.9.2  文件系統
    11.9.3  JDBC
    11.9.4  Elasticsearch
    11.9.5  HBase
    11.9.6  Hive
  11.10  本章總結
第12章  FlinkCEP
  12.1  基本概念
    12.1.1  CEP是什麼
    12.1.2  模式
    12.1.3  應用場景
  12.2  快速上手
    12.2.1  需要引入的依賴
    12.2.2  一個簡單實例
  12.3  模式API
    12.3.1  個體模式
    12.3.2  組合模式
    12.3.3  模式組
    12.3.4  匹配后跳過策略
  12.4  模式的檢測處理
    12.4.1  將模式應用到流上
    12.4.2  處理匹配事件
    12.4.3  處理超時事件
    12.4.4  處理遲到數據
  12.5  CEP的狀態機實現
  12.6  本章總結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032