幫助中心 | 我的帳號 | 關於我們

ETL數據整合與處理(Kettle第2版微課版大數據技術精品系列教材)

  • 作者:編者:鄭健//張良均|責編:初美呈
  • 出版社:人民郵電
  • ISBN:9787115665478
  • 出版日期:2025/10/01
  • 裝幀:平裝
  • 頁數:212
人民幣:RMB 59.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以使用Kettle工具實現ETL流程為目標,將ETL知識點與項目任務相結合,配合真實案例,按照ETL的流程,循序漸進地介紹ETL數據整合與處理的相關內容。全書共6個項目,項目1介紹ETL概念和ETL工具等;項目2以獲取食品銷售源數據為例,介紹獲取不同類型源數據的方法,並說明它們之間的差別;項目3以整合和處理某大型供應鏈集團的食品銷售數據為例,介紹從獲取多份源數據開始,使用排序、合併、剪切、拆分、刪除、過濾、替換和輸出等一系列與ETL流程相匹配的處理方法,整合和處理出一份符合項目階段目標要求的數據的方法,幫助讀者快速理解和掌握ETL;項目4以項目3的階段目標數據作為源數據,介紹進行數據計算和統計的方法,以及將統計結果輸出到不同類型的數據文件中的方式,幫助讀者從業務上理解數據計算和統計的要求,以及輸出結果的方法;項目5介紹Kettle的任務執行方式,構建任務流程,設定調度時間,自動執行項目3中整合和處理食品銷售數據的任務;項目6介紹無人售貨機項目,通過項目案例的形式,幫助讀者將所學知識融會貫通。
    本書可以作為高校大數據相關專業的教材,也可以作為ETL愛好者的自學用書。

作者介紹
編者:鄭健//張良均|責編:初美呈

目錄
項目1 開啟ETL之旅
  任務1.1 認識ETL
    1.1.1 了解ETL
    1.1.2 選擇ETL工具
  任務1.2 配置Kettle運行環境
    1.2.1 安裝JDK
    1.2.2 安裝MySQL資料庫
    1.2.3 配置Kettle
  任務1.3 熟悉Kettle的基本操作
    1.3.1 認識Kettle界面
    1.3.2 了解轉換和任務
    1.3.3 運行工程並查看執行結果
  小結
  實訓
    實訓1 安裝MySQL資料庫
    實訓2 安裝Kettle
  課後習題
項目2 獲取食品銷售源數據
  任務2.1 創建資料庫連接
    2.1.1 新建資料庫連接
    2.1.2 設置資料庫連接參數
    2.1.3 測試和瀏覽資料庫連接
    2.1.4 建立/停止共享資料庫連接
  任務2.2 獲取資料庫的食品銷售數據
    2.2.1 創建「表輸入」組件
    2.2.2 設置組件參數
    2.2.3 預覽獲取的數據
  任務2.3 獲取CSV文件的食品銷售數據
    2.3.1 創建「CSV文件輸入」組件
    2.3.2 設置組件參數
    2.3.3 預覽獲取的數據
  任務2.4 獲取Excel文件的食品銷售數據
    2.4.1 創建「Microsoft Excel input」組件
    2.4.2 設置組件參數
    2.4.3 預覽獲取的數據
  小結
  實訓
    實訓1 獲取資料庫的日化銷售數據
    實訓2 獲取CSV文件的日化銷售數據
    實訓3 獲取Excel文件的日化銷售數據
  課後習題
項目3 整合和處理食品銷售數據
  任務3.1 處理多文件銷售數據
    3.1.1 排序文件數據
    3.1.2 連接銷售數據文件
    3.1.3 欄位選擇
    3.1.4 刪除不規範的「銷售時間」欄位
    3.1.5 替換「包裝單位」欄位的NULL值
  任務3.2 合併銷售數據
    3.2.1 合併數據

    3.2.2 合併所有的銷售數據
  任務3.3 剪切「平台」欄位的字元串
    3.3.1 創建「剪切字元串」組件
    3.3.2 設置組件參數
    3.3.3 預覽結果數據
  任務3.4 拆分「經營單位」欄位
    3.4.1 創建「拆字欄位」組件
    3.4.2 設置組件參數
    3.4.3 預覽結果數據
  任務3.5 刪除數據中的多餘欄位和重複記錄
    3.5.1 刪除多餘欄位
    3.5.2 刪除重複記錄
  任務3.6 過濾並替換不規範的欄位數據
    3.6.1 設定條件過濾記錄
    3.6.2 規範欄位數據
  任務3.7 輸出銷售數據到資料庫表
    3.7.1 創建「表輸出」組件
    3.7.2 設置組件參數
    3.7.3 預覽結果數據
  小結
  實訓
    實訓1 合併D平台的日化銷售數據
    實訓2 處理B、C平台的日化銷售數據
    實訓3 整合和處理A、B、C、D平台的日化銷售數據
  課後習題
項目4 統計食品銷售數據
  任務4.1 計算訂單利潤和利潤率
    4.1.1 創建計算訂單利潤和利潤率的組件
    4.1.2 設置組件參數
    4.1.3 預覽結果數據
  任務4.2 計算單價
    4.2.1 創建「計算器」組件
    4.2.2 設置組件參數
    4.2.3 預覽結果數據
  任務4.3 聚合統計銷售額數據
    4.3.1 聚合統計銷售額
    4.3.2 輸出聚合統計結果
  任務4.4 統計平台食品銷售數據
    4.4.1 分組統計
    4.4.2 輸出結果到資料庫
  任務4.5 統計分公司食品銷售數據
    4.5.1 評出「優秀經營單位」
    4.5.2 插入結果到資料庫
  任務4.6 統計商品品牌食品銷售數據
    4.6.1 創建「SQL文件輸出」組件
    4.6.2 設置組件參數
    4.6.3 預覽結果數據
  任務4.7 對銷售額進行離散化統計
    4.7.1 對銷售額大小進行分段
    4.7.2 分段統計並輸出結果到Excel文件

  小結
  實訓
    實訓1 計算日化銷售數據中各個訂單的利潤、利潤率
    實訓2 統計平台日化銷售數據
    實訓3 統計分公司日化銷售數據
    實訓4 統計各個商品品牌的日化銷售數據
  課後習題
項目5 執行整合與處理食品銷售數據任務
  任務5.1 開始任務
    5.1.1 創建「Start」組件
    5.1.2 設置組件參數
    5.1.3 運行任務
  任務5.2 檢查輸入源數據文件
    5.2.1 檢查源數據文件是否存在
    5.2.2 等待文件上傳
  任務5.3 檢查輸出數據表
    5.3.1 檢查輸出數據表是否存在
    5.3.2 使用「SQL」組件生成輸出數據表
  任務5.4 執行數據整合與處理轉換工程任務
    5.4.1 創建「執行數據整合與處理工程」組件
    5.4.2 設置組件參數
    5.4.3 運行任務
  任務5.5 添加日誌文件
    5.5.1 創建「添加文件到結果文件中」組件
    5.5.2 設置組件參數
    5.5.3 運行任務
  任務5.6 發送日誌郵件
    5.6.1 創建「發送郵件」組件
    5.6.2 設置組件參數
    5.6.3 運行任務
  任務5.7 結束任務
    5.7.1 創建「成功」組件
    5.7.2 設置組件參數
    5.7.3 運行任務
  小結
  實訓
    實訓1 執行日化銷售數據整合與處理任務
    實訓2 執行統計日化銷售數據任務
  課後習題
項目6 無人售貨機項目實戰
  任務6.1 了解無人售貨機項目背景與目標
    6.1.1 了解項目背景
    6.1.2 熟悉項目目標
    6.1.3 熟悉數據欄位
  任務6.2 統計客戶訂單數據
    6.2.1 分析任務數據和數據處理需求
    6.2.2 熟悉任務流程
    6.2.3 實現客戶訂單數據的統計
  任務6.3 統計商品銷售數據
    6.3.1 分析任務數據和數據處理需求

    6.3.2 熟悉任務流程
    6.3.3 實現商品銷售數據的統計
  任務6.4 統計無人售貨機日銷售數據
    6.4.1 分析任務數據和數據處理需求
    6.4.2 熟悉任務流程
    6.4.3 實現無人售貨機日銷售數據的統計
  任務6.5 統計無人售貨機銷售盈利數據
    6.5.1 分析任務數據和數據處理需求
    6.5.2 熟悉任務流程
    6.5.3 實現無人售貨機銷售盈利數據的統計
  小結
  課後習題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032