幫助中心 | 我的帳號 | 關於我們

數據清洗(微課視頻版)/大數據與人工智慧技術叢書

  • 作者:編者:黃源//何婕|責編:王冰飛//吳彤雲
  • 出版社:清華大學
  • ISBN:9787302577478
  • 出版日期:2021/08/01
  • 裝幀:平裝
  • 頁數:272
人民幣:RMB 49.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書的編寫目的是向讀者介紹數據清洗技術的基本概念與應用。全書共10章,分別為數據清洗概述、文件格式、Web數據抽取、網路爬蟲、Kettle數據清洗、數據遷移、文本數據處理、Python數據清洗、DataCleaner數據分析與清洗以及數據清洗綜合實訓。本書將理論與實踐操作相結合,通過大量的案例幫助讀者快速了解和應用數據清洗相關技術,並對書中重要的、核心的知識點加大練習力度,以達到熟練應用的目的。
    本書可作為高等學校大數據、人工智慧、雲計算等專業的教材,可也作為大數據愛好者的參考書。

作者介紹
編者:黃源//何婕|責編:王冰飛//吳彤雲

目錄
第1章  數據清洗概述
  1.1  數據清洗基礎
    1.1.1  數據清洗的定義
    1.1.2  數據清洗的原理
    1.1.3  數據清洗的流程
    1.1.4  數據清洗的常用方法
    1.1.5  數據清洗的評估描述
    1.1.6  數據清洗中的常用評測數據集
  1.2  數據質量與數據倉庫
    1.2.1  數據質量的定義
    1.2.2  常見的數據質量問題
    1.2.3  數據質量與數據清洗
    1.2.4  數據倉庫與ETL
    1.2.5  數據映射
    1.2.6  主數據與元數據
  1.3  數據清洗中的統計基礎
    1.3.1  描述性統計
    1.3.2  推論統計
    1.3.3  隨機變數
  1.4  數據清洗環境與常用工具
    1.4.1  數據清洗環境介紹
    1.4.2  數據清洗常用工具
  1.5  本章小結
  1.6  實訓
  習題1
第2章  文件格式
  2.1  文件格式概述
  2.2  Kettle中文件格式的轉換
    2.2.1  文本文件轉換
    2.2.2  CSV文件轉換
    2.2.3  XML文件轉換
    2.2.4  JSON文件轉換
    2.2.5  Excel文件轉換
    2.2.6  生成記錄轉換
  2.3  本章小結
  2.4  實訓
  習題2
第3章  Web數據抽取
  3.1  Web數據抽取基礎
  3.2  Web數據抽取的實現
    3.2.1  Kettle數據抽取原理
    3.2.2  Kettle數據抽取實現
  3.3  本章小結
  3.4  實訓
  習題3
第4章  網路爬蟲
  4.1  網路爬蟲基礎
  4.2  Python3網路爬蟲實現
    4.2.1  urllib模塊
    4.2.2  Requests庫

    4.2.3  BeautifulSoup庫
  4.3  Python3網路爬蟲實例
    4.3.1  urllib實例
    4.3.2  requests實例
  4.4  本章小結
  4.5  實訓
  習題4
第5章  Kettle數據清洗
  5.1  Kettle數據清洗概述
  5.2  Kettle數據清洗實現
    5.2.1  清洗簡單數據
    5.2.2  清洗複雜數據
  5.3  本章小結
  5.4  實訓
  習題5
第6章  數據遷移
  6.1  數據遷移概述
  6.2  數據遷移實現技術
    6.2.1  基於主機的遷移方式
    6.2.2  備份恢復的遷移方式
    6.2.3  基於存儲的遷移方式
    6.2.4  基於文件系統的遷移方式
    6.2.5  基於資料庫的遷移方式
  6.3  數據遷移實現
    6.3.1  資料庫安裝與使用
    6.3.2  Kettle數據遷移
  6.4  本章小結
  6.5  實訓
  習題6
第7章  文本數據處理
  7.1  文本分詞
  7.2  文本數據處理方法
  7.3  jieba分詞的應用
    7.3.1  jieba概述
    7.3.2  jieba應用實例
  7.4  本章小結
  7.5  實訓
  習題7
第8章  Python數據清洗
  8.1  Python數據清洗概述
    8.1.1  Python數據清洗相關庫
    8.1.2  Python數據清洗庫的安裝
  8.2  NumPy使用
    8.2.1  數組的創建與使用
    8.2.2  計算模塊與隨機模塊的使用
    8.2.3  NumPy數據清洗實例
  8.3  Pandas使用
    8.3.1  Pandas數據類型概述
    8.3.2  Pandas數據類型應用
    8.3.3  Pandas數據清洗

  8.4  matplotlib使用
    8.4.1  matplotlib的介紹
    8.4.2  matplotlib的應用
  8.5  Python數據清洗實例
    8.5.1  清洗內部數據
    8.5.2  清洗外部數據
  8.6  本章小結
  8.7  實訓
  習題8
第9章  DataCleaner數據分析與清洗
  9.1  DataCleaner簡介
    9.1.1  DataCleaner概述
    9.1.2  DataCleaner界面認識
  9.2  DataCleaner應用
    9.2.1  認識DataCleaner
    9.2.2  DataCleaner數據分析實例
  9.3  本章小結
  9.4  實訓
  習題9
第10章  數據清洗綜合實訓
  10.1  Python數據分組與顯示
  10.2  Python數據清洗與顯示
  10.3  Kettle分組排序
  10.4  Kettle模糊匹配
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032