幫助中心 | 我的帳號 | 關於我們

數據清洗(第2版大數據類專業規劃教材)/大數據技術與應用叢書

  • 作者:編者:黑馬程序員|責編:袁勤勇
  • 出版社:清華大學
  • ISBN:9787302670292
  • 出版日期:2024/08/01
  • 裝幀:平裝
  • 頁數:307
人民幣:RMB 58 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以Kettle 9.2為基礎,全面介紹使用Kettle實現ETL的相關操作。全書共8章,分別講解數據清洗和ETL的概念,Kettle的安裝和使用,如何使用Kettle實現數據抽取、數據清洗、數據轉換和數據載入,並在最後綜合運用上述知識,構建一個電影租賃商店數據倉庫,以使讀者加深對Kettle和ETL的理解與掌握。
    本書附有配套視頻、教學PPT、教學設計、測試題等資源,同時,為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關注。
    本書可以作為高等院校數據科學與大數據技術及相關專業的教材,也適合大數據開發初學者、ETL工程師以及數倉開發的從業者閱讀。

作者介紹
編者:黑馬程序員|責編:袁勤勇

目錄
第1章  數據清洗概述
  1.1  數據清洗的背景
    1.1.1  數據質量概述
    1.1.2  數據質量的評價指標
    1.1.3  數據質量問題的分類
  1.2  數據清洗的定義
  1.3  數據清洗基本流程
  1.4  數據清洗策略
  1.5  數據清洗常用的方法
  1.6  數據清洗面臨的挑戰
  1.7  本章小結
  1.8  課後習題
第2章  初識ETL
  2.1  ETL的定義
  2.2  ETL的體系結構
  2.3  ETL關鍵步驟
    2.3.1  抽取
    2.3.2  轉換
    2.3.3  載入
  2.4  常見的ETL工具
  2.5  本章小結
  2.6  課後習題
第3章  Kettle
  3.1  初識Kettle
    3.1.1  Kettle簡介
    3.1.2  Kettle的特點
  3.2  Kettle的安裝與啟動
  3.3  Kettle的轉換和作業
    3.3.1  轉換
    3.3.2  作業
  3.4  Kettle的基本操作
    3.4.1  轉換管理
    3.4.2  作業管理
    3.4.3  資料庫連接
  3.5  本章小結
  3.6  課後習題
第4章  數據抽取
  4.1  從文件中抽取數據
    4.1.1  從CSV文件中抽取數據
    4.1.2  從TSV文件中抽取數據
    4.1.3  從JSON文件中抽取數據
    4.1.4  從XML文件中抽取數據
    4.1.5  從HDFS中抽取數據
  4.2  從資料庫中抽取數據
    4.2.1  從關係資料庫中抽取數據
    4.2.2  從非關係資料庫中抽取數據
  4.3  從Hive中抽取數據
  4.4  從HTML頁面中抽取數據
  4.5  本章小結
  4.6  課後習題

第5章  數據清洗
  5.1  重複值處理
  5.2  缺失值處理
    5.2.1  缺失值處理策略
    5.2.2  刪除缺失值
    5.2.3  填補缺失值
  5.3  異常值處理
    5.3.1  刪除異常值
    5.3.2  替換異常值
  5.4  本章小結
  5.5  課後習題
第6章  數據轉換
  6.1  數據規範化處理
    6.1.1  數據規範化處理概述
    6.1.2  數據規範化處理過程
  6.2  多數據源合併
    6.2.1  多數據源合併方法
    6.2.2  多數據源合併過程
  6.3  數據粒度轉換
  6.4  數據的商務規則計算
  6.5  本章小結
  6.6  課後習題
第7章  數據載入
  7.1  將數據載入到文本文件
  7.2  將數據載入到資料庫
    7.2.1  將數據載入到關係資料庫
    7.2.2  將數據載入到非關係資料庫
  7.3  將數據載入到Hive
  7.4  本章小結
  7.5  課後習題
第8章  綜合案例——構建電影租賃商店數據倉庫
  8.1  案例概述
    8.1.1  案例背景介紹
    8.1.2  資料庫簡介
    8.1.3  數據倉庫簡介
  8.2  環境準備
  8.3  案例實現
    8.3.1  向維度表dim_date載入數據
    8.3.2  向維度表dim_time載入數據
    8.3.3  向維度表dim_staff載入數據
    8.3.4  向維度表dim_customer載入數據
    8.3.5  向維度表dim_store載入數據
    8.3.6  向維度表dim_actor載入數據
    8.3.7  向維度表dim_film載入數據
    8.3.8  向橋接表dimjilm_actor_bridge載入數據
    8.3.9  向事實表fact_rental載入數據
    8.3.10  定期向數據倉庫sakila_dwh載入數據
  8.4  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032