幫助中心 | 我的帳號 | 關於我們

Flink大數據分析實戰

  • 作者:編者:張偉洋|責編:王金柱
  • 出版社:清華大學
  • ISBN:9787302598183
  • 出版日期:2022/02/01
  • 裝幀:平裝
  • 頁數:348
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書由資深大數據專家精心編寫,循序漸進地介紹了Flink生態系統主流的大數據開發技術。全書共7章,第1章講解Flink的基礎知識,包括Flink應用場景、主要組件、編程模型等,最後通過一個單詞計數示例帶領讀者快速體驗Flink應用程序的編寫;第2、3章講解Flink的多種運行時架構、任務調度原理、數據分區以及Flink集群的安裝部署,同時包括Flink命令行操作、應用程序提交、常用Shell命令等;第4?7章講解了Flink流式計算DataStream API、關係型計算Table&SQL API以及圖計算框架Gelly等的基礎知識、架構原理,同時包括常用Shell命令、API操作、內核源碼剖析,並通過多個實際案例講解各個框架的具體應用以及與Hadoop生態系統框架Hive、Kafka的整合操作。
    本書內容翔實,實例豐富,適合Flink新手、大數據開發人員閱讀,也可作為培訓機構和大專院校相關專業的教學用書。

作者介紹
編者:張偉洋|責編:王金柱
    張偉洋,大數據領域資深專家,擁有多年頂尖互聯網公司軟體研發經驗,曾在互聯網旅遊公司任軟體研發事業部經理。目前從事大數據項目講師工作,先後多次給各大高校舉行大數據專題講座,對Hadoop及周邊大數據框架ZooKeeper、Hive、HBase、Storm、Spark、Flink等有著深入的研究。高等院校雲計算與大數據專業課改教材《雲計算與大數據概論》《大數據開發與應用》的主要編寫者。

目錄
第1章  初識Flink
  1.1  大數據開發總體架構
  1.2  什麼是Flink
  1.3  Flink的應用場景
  1.4  流計算框架對比
  1.5  Flink的主要組件
  1.6  Flink編程模型
    1.6.1  數據集
    1.6.2  編程介面
    1.6.3  程序結構
  1.7  快速體驗Flink程序
    1.7.1  IntelliJ IDEA安裝Scala插件
    1.7.2  IntelliJ IDEA創建Flink項目
    1.7.3  示例:批處理單詞計數
    1.7.4  示例:流處理單詞計數
第2章  Flink運行架構及原理
  2.1  Flink運行時架構
    2.1.1  YARN集群架構
    2.1.2  Flink Standalone架構
    2.1.3  Flink On YARN的架構
  2.2  Flink任務調度原理
    2.2.1  任務鏈
    2.2.2  並行度
    2.2.3  共享Task Slot
    2.2.4  數據流
    2.2.5  執行圖
    2.2.6  執行計劃
  2.3  Flink數據分區
    2.3.1  分區數量
    2.3.2  分區策略
第3章  Flink安裝及部署
  3.1  Flink集群搭建
    3.1.1  Flink本地模式搭建
    3.1.2  Flink Standalone搭建
    3.1.3  Flink On YARN搭建
  3.2  Flink HA模式
    3.2.1  Flink Standalone模式的HA架構
    3.2.2  Flink Standalone模式HA集群搭建
    3.2.3  Flink On YARN模式HA集群搭建
  3.3  Flink命令行界面
  3.4  Flink應用提交
  3.5  Flink Shell的使用
第4章  Flink DataStream API
  4.1  基本概念
  4.2  執行模式
  4.3  作業流程
  4.4  程序結構
  4.5  Source數據源
    4.5.1  基本數據源
    4.5.2  高級數據源

    4.5.3  自定義數據源
  4.6  Transformation數據轉換
  4.7  Sink數據輸出
  4.8  數據類型與序列化
  4.9  分區策略
    4.9.1  內置分區策略
    4.9.2  自定義分區策略
  4.10  窗口計算
    4.10.1  事件時間
    4.10.2  窗口分類
    4.10.3  窗口函數
    4.10.4  觸發器
    4.10.5  清除器
  4.11  水印
    4.11.1  計算規則
    4.11.2  允許延遲與側道輸出
    4.11.3  生成策略
  4.12  狀態管理
    4.12.1  Keyed State
    4.12.2  Operator State
  4.13  容錯機制
    4.13.1  Checkpoint
    4.13.2  Barrier
    4.13.3  重啟與故障恢復策略
    4.13.4  Savepoint
  4.14  案例分析:計算5秒內輸入的單詞數量
  4.15  案例分析:統計5分鐘內每個用戶產生的日誌數量
  4.16  案例分析:統計24小時內每個用戶的訂單平均消費額
  4.17  案例分析:計算5秒內每個信號燈通過的汽車數量
  4.18  案例分析:Flink整合Kafka計算實時單詞數量
  4.19  案例分析:天貓雙十一實時交易額統計
    4.19.1  創建自定義數據源
    4.19.2  計算各個分類的訂單總額
    4.19.3  計算全網銷售總額與分類Top3
第5章  Flink Table API&SQL
  5.1  基本概念
    5.1.1  計劃器
    5.1.2  API架構
    5.1.3  程序結構
  5.2  動態表
    5.2.1  流映射為動態表
    5.2.2  連續查詢
    5.2.3  動態表轉換為流
  5.3  TableEnvironment API
    5.3.1  基本概念
    5.3.2  創建TableEnvironment
    5.3.3  示例:簡單訂單統計
  5.4  Table API
    5.4.1  基本概念
    5.4.2  示例:訂單分組計數

    5.4.3  示例:每小時訂單分組求平均值
    5.4.4  關係操作
  5.5  SQL API
    5.5.1  DDL操作
    5.5.2  DML操作
    5.5.3  DQL操作
    5.5.4  窗口函數
    5.5.5  窗口聚合
    5.5.6  分組聚合
    5.5.7  OVER聚合
    5.5.8  連接查詢
  5.6  TopN查詢
    5.6.1  OVER子句
    5.6.2  示例:計算產品類別銷售額TopN
    5.6.3  示例:搜索詞熱度統計
    5.6.4  窗口TopN
  5.7  Catalog元數據管理
  5.8  Flink SQL整合Kafka
    5.8.1  基本概念
    5.8.2  示例:Flink SQL整合Kafka實現實時ETL
  5.9  Flink SQL CLI
    5.9.1  啟動SQL CLI
    5.9.2  執行SQL查詢
    5.9.3  可視化結果模式
  5.10  Flink SQL整合Hive
    5.10.1  整合步驟
    5.10.2  Table API操作Hive
    5.10.3  示例:Flink SQL整合Hive分析搜狗用戶搜索日誌
  5.11  案例分析:Flink SQL實時單詞計數
  5.12  案例分析:Flink SQL實時計算5秒內用戶訂單總金額
  5.13  案例分析:微博用戶行為分析
    5.13.1  離線與實時計算業務架構
    5.13.2  Flume數據採集架構
    5.13.3  Kafka消息隊列架構
  5.14  案例分析:Flink SQL智慧交通數據分析
    5.14.1  項目介紹
    5.14.2  數據準備
    5.14.3  統計正常卡口數量
    5.14.4  統計車流量排名前3的卡口號
    5.14.5  統計每個卡口通過速度最快的前3輛車
    5.14.6  車輛軌跡分析
第6章  Flink內核源碼
  6.1  流圖
    6.1.1  StreamGraph核心對象
    6.1.2  StreamGraph生成過程
  6.2  作業圖
    6.2.1  JobGraph的核心對象
    6.2.2  JobGraph的生成過程
  6.3  執行圖
    6.3.1  ExecutionGraph的核心對象

    6.3.2  ExecutionGraph的生成過程
第7章  Gelly圖計算
  7.1  什麼是Gelly
  7.2  第一個Gelly程序
  7.3  Gelly數據結構
  7.4  如何使用Gelly
  7.5  圖操作
    7.5.1  基本操作
    7.5.2  屬性操作
    7.5.3  結構操作
    7.5.4  連接操作
  7.6  圖常用API
    7.6.1  創建圖
    7.6.2  圖的轉換
    7.6.3  圖的添加與移除
    7.6.4  圖的鄰域方法
  7.7  案例分析:Gelly計算社交網路中粉絲的平均年齡

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032