幫助中心 | 我的帳號 | 關於我們

Spark大數據商業實戰三部曲(內核解密商業案例性能調優)(精)

  • 作者:編者:王家林//段智華//夏陽
  • 出版社:清華大學
  • ISBN:9787302489627
  • 出版日期:2018/02/01
  • 裝幀:精裝
  • 頁數:1143
人民幣:RMB 299 元      售價:
放入購物車
加入收藏夾

內容大鋼
    王家林、段智華、夏陽編著的《Spark大數據商業實戰三部曲(內核解密商業案例性能調優)(精)》基於Spark 2.2.x最新版本,以spark商業案例實戰和Spark在生產環境下幾乎所有類型的性能調優為核心,以spark內核解密為基石,分為上篇、中篇、下篇,對企業生產環境下的spark商業案例與性能調優抽絲剝繭地進行剖析。上篇基於Spark源碼,從一個動手實戰案例入手,循序漸進地全面解析了Spark 2.2.x新特性及Spark內核源碼;中篇選取Spark開發中最具有代表的經典學習案例,深入淺出地介紹,在案例中綜合應用Spark的大數據技術;下篇性能調優內容基本完全覆蓋了Spark在生產環境下的所有調優技術。
    本書適合所有spark學習者和從業人員使用。對於有分散式計算框架應用經驗的人員,本書也可以作為Spark高手修煉的參考書籍。同時,本書也特別適合作為高等院校的大數據教材使用。

作者介紹
編者:王家林//段智華//夏陽

目錄
上篇  內核解密
  第1章  電光石火間體驗Spark 2.2開發實戰
    1.1  通過RDD實戰電影點評系統入門及源碼閱讀
    1.1.1  Spark核心概念圖解
    1.1.2  通過RDD實戰電影點評系統案例
    1.2  通過DataFrame和DataSet實戰電影點評系統
    1.2.1  通過DataFrame實戰電影點評系統案例
    1.2.2  通過DataSet實戰電影點評系統案例
    1.3  Spark 2.2源碼閱讀環境搭建及源碼閱讀體驗
  第2章  Spark 2.2技術及原理
    2.1  Spark 2.2綜述
    2.1.1  連續應用程序
    2.1.2  新的
    2.2  Spark 2.2
    2.2.1  第二代Tungsten引擎
    2.2.2  SparkSe
    2.2.3  累加器
    2.3  Spark 2.
    2.3.1  Spar
    2.3.2  DataFrame和Datas
    2.3.3  Timed Wi
    2.4  Spark 2.2 Stre
    2.4.1  Structured Stre
    2.4.2  增量輸出模式
    2.5  Spark 2.2
    2.5.1  基於DataFrame的Machine Learni
    2.5.2  R的分散式演算法
    2.6  Spark 2.2 Gr
  第3章  Spark的靈魂:RDD和D
    3.1  為什麼說RDD和DataSet是Spark的靈魂
    3.1.1  RDD的定義及五大特性剖析
    3.1.2  DataSet的定義及內部機制剖析
    3.2  RDD彈性特性七個方面解析
    3.3  RDD依賴關係
    3.3.1  窄依賴解析
    3.3.2  寬依賴解析
    3.4  解析Spark中的DAG邏輯視圖
    3.4.1  DAG生成的機制
    3.4.2  DAG邏輯視圖解析
    3.5  RDD內部的電腦制
    3.5.1  Task解析
    3.5.2  計算過程深度解析
    3.6  Spark RDD容錯原理及其四大核心要點解析
    3.6.1  Spark RDD容錯原理
    3.6.2  RDD容錯的四大核心要點
    3.7  Spark RDD中Runtime流程解析
    3.7.1  Runtime架構圖
    3.7.2  生命周期
    3.8  通過WordCount實戰解析Spark RDD內部機制
    3.8.1  Spark WordCount動手實踐

    3.8.2  解析RDD生成的內部機制
    3.9  基於DataSet的代碼到底是如何一步步轉化成為RDD的
  第4章  Spark Driver啟動內幕剖析
    4.1  Spark Driver Program剖析
    4.1.1  Spark Driver Pro
    4.1.2  SparkContext深度剖析
    4.1.3  SparkContext源碼解析
    4.2  DAGScheduler解析
    4.2.1  DAG的定義
    4.2.2  DAG的實例化
    4.2.3  DAGScheduler劃分Stage的原理
    4.2.4  DAGScheduler劃分Stage的具體演算法
    4.2.5  Stage內部Task獲取最佳位置的演算法
    4.3  TaskScheduler解析
    4.3.1  TaskScheduler原理剖析
    4.3.2  TaskScheduler源碼解析
    4.4  SchedulerBackend解析
    4.4.1  SchedulerBackend原理剖析
    4.4.2  SchedulerBackend源碼解析
    4.4.3  Spark程序的註冊機制
    4.4.4  Spark程序對計算資源Executor的管理
    4.5  打通Spark系統運行內幕機制循環流程
    4.6  本章總結
中篇  商業案例
下篇  性能調優

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032