幫助中心 | 我的帳號 | 關於我們

Apache Spark大數據分析(基於Azure Databricks雲平台)

  • 作者:(瑞典)羅伯特·伊利傑森|責編:傅道坤|譯者:袁國忠
  • 出版社:人民郵電
  • ISBN:9787115614568
  • 出版日期:2023/06/01
  • 裝幀:平裝
  • 頁數:236
人民幣:RMB 79.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    Azure Databricks是一款基於雲的大數據分析和機器學習平台,用於實現基於Apache Spark的數據處理,為快速增長的海量數據的處理和決策需求分析提供了良好的支撐。
    本書詳細介紹基於Azure Databricks雲平台來使用Apache Spark完成大規模數據處理和分析的方法。本書總計11章,首先介紹大規模數據分析相關的概念;然後介紹受管的Spark及其與Databricks的關係,以及Databricks的版本差異和使用方法(涵蓋工作區、集群、筆記本、Databricks文件系統、數據導入/導出等內容);接著介紹使用SQL和Python分別實現數據分析的過程,數據提取、變換、載入、存儲、優化技巧等高階數據處理方法以及外部連接工具、生產環境集成等內容;最後探討了運行機器學習演算法、合併數據更新以及通過API運行Databricks、Delta流處理等高階主題。
    作為數據分析領域的入門書,本書具有很強的實用性,可供數據工程師、數據分析師和決策分析人員等學習和參考。

作者介紹
(瑞典)羅伯特·伊利傑森|責編:傅道坤|譯者:袁國忠
    羅伯特·伊利傑森(Robert Ilijason),商務智能領域深耕20年的戰場老兵,曾擔任過歐洲一些大公司的外包人,並在零售、電信、銀行、政府機構等領域做過大規模數據分析項目。多年來,數據分析領域的各種風尚潮起潮落,但他深信雲端Apache Spark(尤其是與Databricks一起)與眾不同,將是遊戲規則的改變者。

目錄
第1章  大規模數據分析簡介
  1.1  宣傳中的數據分析
  1.2  現實中的數據分析
  1.3  大規模數據分析
  1.4  數據——分析中的燃料
  1.5  免費的工具
  1.6  進入雲端
  1.7  Databricks——懶人的分析工具
  1.8  如何分析數據
  1.9  真實世界的大規模數據分析示例
    1.9.1  Volvo Trucks的遠程信息處理
    1.9.2  Visa的欺詐識別
    1.9.3  Target的客戶分析
    1.9.4  Cambridge Analytica有針對性的廣告投放
  1.10  小結
第2章  Spark和Databricks
  2.1  Apache Spark簡介
  2.2  Databricks—受管的Apache Spark
  2.3  Spark的架構
    2.3.1  Apache Spark如何處理作業
    2.3.2  數據
  2.4  內核之上的出色組件
  2.5  小結
第3章  Databricks初步
  3.1  只能通過雲來使用
  3.2  免費的社區版
    3.2.1  差不多夠用了
    3.2.2  使用社區版
  3.3  夢寐以求的商業版
    3.3.1  Amazon Web Services上的Databricks
    3.3.2  Azure Databricks
  3.4  小結
第4章  工作區、集群和筆記本
  4.1  在UI中漫遊
  4.2  集群
  4.3  數據
  4.4  筆記本
  4.5  小結
第5章  將數據載入Databricks
  5.1  Databricks文件系統
    5.1.1  文件系統導航
  ……
第6章  使用SQL查詢數據
第7章  Python的威力
第8章  ETL和高級數據整理
第9章  在Databricks和外部工具之間建立連接
第10章  在生產環境中運行解決方案
第11章  雜項

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032