幫助中心 | 我的帳號 | 關於我們

Python數據預處理(Python技術微課版工業和信息化精品系列教材)

  • 作者:編者:汪靜//鄭婷婷|責編:范博濤
  • 出版社:人民郵電
  • ISBN:9787115596222
  • 出版日期:2023/03/01
  • 裝幀:平裝
  • 頁數:180
人民幣:RMB 49.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書的設計和編寫目標是培養讀者的數據思維能力和數據預處理能力,內容具有典型性和實用性,全面介紹基於Python的數據預處理的流程和技術。
    全書共8個單元,單元1介紹數據預處理的基礎知識,單元2介紹Python數據預處理工具pandas的用法及主要數據結構的用法,單元3?單元7依次介紹數據預處理流程中數據獲取、數據合併、數據清洗、數據變換和數據描述等相關知識和技術。
    為著重培養讀者的動手能力,本書單元2?單元7都配套了任務實踐和拓展實訓,除單元8,每個單元還配套了課後習題。單元8為綜合案例,通過網易雲音樂相關數據集展示數據預處理的完整流程,幫助讀者全面掌握全書相關知識和技術。
    本書適合作為高等教育本、專科院校大數據技術和人工智慧技術應用等相關專業的教材,也可作為數據分析培訓班和「1+X」數據處理相關職業技能等級證書的教材。

作者介紹
編者:汪靜//鄭婷婷|責編:范博濤

目錄
單元1  數據預處理基礎
  1.1  數據預處理簡介
    1.1.1  數據與數據預處理
    1.1.2  數據預處理的重要性
    1.1.3  數據預處理的過程
  1.2  搭建Python開發環境
    1.2.1  Python概述
    1.2.2  安裝Anaconda
    1.2.3  創建Python虛擬環境
    1.2.4  認識JupyterLab
    1.2.5  輸出「Hello World!」
  1.3  總結
  課後習題
單元2  pandas入門
  2.1  pandas概述
  2.2  pandas的安裝和導入
  2.3  Series對象
    2.3.1  Series對象的特點
    2.3.2  Series對象的創建
    2.3.3  Series對象的索引
    2.3.4  Series對象的操作
    任務實踐2-1:小明成績表的操作
  2.4  DataFrame對象
    2.4.1  DataFrame對象的特點
    2.4.2  DataFrame對象的創建
    2.4.3  DataFrame對象的索引
    2.4.4  DataFrame對象的操作
    任務實踐2-2:小明宿舍所有同學成績表的操作
  2.5  總結
  拓展實訓:處理網上招聘數據
  課後習題
單元3  數據獲取
  3.1  數據爬取
    3.1.1  網路爬蟲原理概述
    3.1.2  簡易網路爬蟲示例
  3.2  數據讀寫
    3.2.1  讀寫XLS文件或XLSX文件
    3.2.2  讀寫CSV文件
    3.2.3  讀寫TXT文件
    3.2.4  讀寫JSON文件
    3.2.5  讀寫MySQL數據
    任務實踐3:讀寫商品類別文件
  3.3  總結
  拓展實訓:讀寫廣州市郵政編碼數據
  課後習題
單元4  數據合併
  4.1  堆疊合併數據
    4.1.1  橫向堆疊合併
    4.1.2  縱向堆疊合併
    4.1.3  交叉堆疊合併

    任務實踐4-1:合併商品銷售數據
  4.2  主鍵合併數據
    4.2.1  左連接
    4.2.2  右連接
    4.2.3  內連接
    4.2.4  外連接
    任務實踐4-2:合併成績表
  4.3  重疊合併數據
    任務實踐4-3:修補統計數據
  4.4  總結
  拓展實訓:合併網易雲音樂愛國歌曲數據
  課後習題
單元5  數據清洗
  5.1  缺失值處理
    5.1.1  查看缺失值
    5.1.2  處理缺失值
    任務實踐5-1:網上招聘數據缺失值處理
  5.2  重複值處理
    5.2.1  查看重複值
    5.2.2  處理重複值
    任務實踐5-2:網上招聘數據重複值處理
  5.3  異常值處理
    5.3.1  檢測異常值
    5.3.2  處理異常值
    任務實踐5-3:網上招聘數據異常值處理
  5.4  格式不一致數據處理
    5.4.1  姓名格式不一致的處理
    5.4.2  日期格式不一致的處理
    任務實踐5-4:網上招聘數據中不一致數據的處理
  5.5  總結
  拓展實訓:清洗超市銷售數據
  課後習題
單元6  數據變換
  6.1  數據類型變換
    6.1.1  用astype()方法進行強制類型變換
    6.1.2  用to numeric()方法將數據的類型變換為數值類型
    任務實踐6-1:電影數據類型變換
  6.2  數據格式變換
    6.2.1  設置小數位數
    6.2.2  設置百分比
    6.2.3  設置千位分隔符
    任務實踐6-2:銷售數據格式變換
  6.3  數據映射
    6.3.1  用映射替換數據
    6.3.2  用映射變換數據
    任務實踐6-3:分數變換為等級
  6.4  總結
  拓展實訓:天氣數據變換
  課後習題
單元7  數據描述

  7.1  數據的統計計算
    7.1.1  統計數據的和
    7.1.2  統計數據的均值
    7.1.3  統計數據的最大值/最小值
    7.1.4  統計數據的中位數
    7.1.5  統計數據的眾數
    7.1.6  統計數據的方差和標準差
    7.1.7  統計數據的分位數
    任務實踐7-1:成績表數據的統計計算
  7.2  數據的分組和聚合
    7.2.1  數據的分組
    7.2.2  數據的聚合
    任務實踐7-2:學生成績數據的分組與聚合
  7.3  數據的可視化
    7.3.1  繪製折線圖
    7.3.2  繪製折線圖
    7.3.3  繪製餅圖
    任務實踐7-3:學生期末考試成績的可視化
  7.4  總結
  拓展實訓:用戶職業數據描述
  課後習題
單元8  綜合案例:網易雲音樂數據預處理
  8.1  數據讀取
  8.2  數據合併
  8.3  數據清洗
  8.4  數據變換
  8.5  數據描述
  8.6  總結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032