幫助中心 | 我的帳號 | 關於我們

數字化轉型實踐(構建雲原生大數據平台)/數字化轉型理論與實踐系列叢書

  • 作者:編者:金鑫//武帥|責編:王群
  • 出版社:電子工業
  • ISBN:9787121440069
  • 出版日期:2022/08/01
  • 裝幀:平裝
  • 頁數:319
人民幣:RMB 109 元      售價:
放入購物車
加入收藏夾

內容大鋼
    21世紀,互聯網行業的爆發開啟了全球數據量急劇增長的新時代,數據已經成為驅動企業數字化轉型的核心力量。整個數據行業的技術能力不斷提升,從資料庫到數據倉庫,再到開源大數據,都在經濟社會中發揮著極其重要的作用。近年來,新興數據技術與雲計算相互輔助,共同發展,誕生了一系列雲原生數據服務,讓企業能夠突破傳統模式的局限,專註于業務,降本增效。本書以全球前沿的雲原生服務為基礎,詳細展現了如何將數據存儲、數據引入、批量數據處理、實時數據處理、數據倉庫、數據可視化和機器學習等核心要素綜合起來,逐步構建一個高效的大數據服務平台。
    本書內容豐富,示例與圖解清晰易懂,既能幫助大數據初學者迅速熟悉大數據技術的核心內容和流程,也適合已經熟悉大數據的技術人員通過雲原生服務進一步優化解決方案。

作者介紹
編者:金鑫//武帥|責編:王群

目錄
第1章  數字化轉型與數據技術
  1.1  數字化轉型
  1.2  基於數據進行數字化轉型
  1.3  數據倉庫
  1.4  大數據
  1.5  數據湖
  1.6  雲計算中數據技術的演進
  1.7  本書目標
第2章  數據存儲
  2.1  數據存儲的發展與趨勢
    2.1.1  集中式文件系統
    2.1.2  網路文件系統
    2.1.3  分散式文件系統
    2.1.4  雲原生存儲
  2.2  Azure Blob對象存儲
    2.2.1  數據冗余策略
    2.2.2  分層存儲
    2.2.3  兼容HDFS的WASB文件系統
  2.3  創建存儲賬號
    2.3.1  訂閱
    2.3.2  資源組
    2.3.3  存儲賬號
  2.4  Azure數據湖存儲
    2.4.1  分層命名空間
    2.4.2  兼容HDFS的ABFS文件系統
  2.5  創建數據湖存儲
  2.6  基於HDFS訪問數據湖存儲
  2.7  在HDInsight中訪問數據湖存儲
  2.8  本章小結
第3章  數據引入
  3.1  什麼是數據引入
  3.2  數據引入面臨的挑戰
  3.3  數據引入工具
  3.4  數據工廠
    3.4.1  什麼是數據工廠
    3.4.2  創建數據工廠
    3.4.3  數據工廠的主要組件
  3.5  引入數據
    3.5.1  數據複製
    3.5.2  管道設計
    3.5.3  參數化
    3.5.4  監控
  3.6  本章小結
第4章  批量數據處理
  4.1  數據處理概述
  4.2  數據處理引擎
    4.2.1  MapReduce
    4.2.2  Spark
  4.3  Databricks
  4.4  使用Databricks處理批量數據

  4.5  Databricks的特性
    4.5.1  依賴庫管理
    4.5.2  Databricks文件系統(DBFS)
    4.5.3  密鑰管理
    4.5.4  Delta Lake
  4.6  使用數據工廠處理批量數據
    4.6.1  設計Data Flow
    4.6.2  Data Flow的設計模式
    4.6.3  如何選擇Data Flow與Databricks
  4.7  本章小結
第5章  實時數據處理
  5.1  什麼是實時數據處理
  5.2  消息隊列
  5.3  Kafka的使用
    5.3.1  創建虛擬網路
    5.3.2  創建Kafka集群
    5.3.3  配置IP advertising
    5.3.4  生產者發送數據
  5.4  實時數據處理引擎
  5.5  使用Spark Structured Streaming處理實時數據
    5.5.1  連通Kafka與Databricks
    5.5.2  在Databricks中處理數據
    5.5.3  使用Cosmos DB保存數據
  5.6  Event Hub
  5.7  本章小結
第6章  數據倉庫
  6.1  什麼是數據倉庫
  6.2  雲原生數據倉庫
  6.3  Synapse Analytics
    6.3.1  什麼是Synapse Analytics
    6.3.2  Synapse SQL的架構
    6.3.3  創建Synapse工作區
    6.3.4  創建SQL池
    6.3.5  連接SQL池
  6.4  數據載入
    6.4.1  數據載入方式
    6.4.2  使用COPY導入數據
  6.5  Synapse SQL的資源和負荷管理
    6.5.1  資源類
    6.5.2  併發槽
    6.5.3  最大併發查詢數
    6.5.4  工作負荷組
    6.5.5  工作負荷分類器
  6.6  數據倉庫發展趨勢
    6.6.1  挑戰
    6.6.2  趨勢
  6.7  Synapse Analytics的高級特性
    6.7.1  Synapse 工作室
    6.7.2  數據中心
    6.7.3  無伺服器SQL池

    6.7.4  托管Spark
  6.8  本章小結
第7章  數據可視化
  7.1  數據可視化概述
  7.2  數據可視化工具
  7.3  Power BI
    7.3.1  什麼是Power BI
    7.3.2  Power BI的構件
    7.3.3  使用Power BI Desktop
    7.3.4  使用Power BI服務
  7.4  本章小結
第8章  機器學習
  8.1  機器學習概述
    8.1.1  演算法類型
    8.1.2  業務場景
  8.2  機器學習的流程
  8.3  機器學習的挑戰與雲原生平台的優勢
  8.4  雲原生機器學習平台
    8.4.1  創建工作區
    8.4.2  創建數據存儲庫
    8.4.3  創建數據集
    8.4.4  創建計算資源
  8.5  機器學習設計器
  8.6  自動化機器學習
  8.7  本章小結
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032