幫助中心 | 我的帳號 | 關於我們

Python數據預處理技術(新形態一體化創新型教材)

  • 作者:編者:蔡黎亞|責編:王劍喬
  • 出版社:清華大學
  • ISBN:9787302659631
  • 出版日期:2024/05/01
  • 裝幀:平裝
  • 頁數:220
人民幣:RMB 49 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書共包含了7個Python數據預處理庫(csv、json、jieba、NumPy、OpenCV、Pandas、Pyecharts)的應用及實例講解。適用於人工智慧、數據處理及大數據分析領域中相關Python學習的中級及高級用戶,其中數百個庫函數的使用說明也可以作為該領域專業用戶的使用參考。本書配有教案、教學課件、習題題庫等。
    本書適合作為高等院校電腦及相關專業的教材和教學參考書,也可作為相關開發人員的自學用書和參考手冊。

作者介紹
編者:蔡黎亞|責編:王劍喬

目錄
第1章  Python的標準庫與擴展庫
  1.1  本章介紹
  1.2  數據處理中的常用標準庫
  1.3  數據處理中的常用擴展庫
  1.4  PyCharm IDE的下載與安裝
    1.4.1  Python擴展庫的下載
    1.4.2  PyCharm IDE的下載與安裝配置
    1.4.3  PyCharm IDE中安裝Python擴展庫
    1.4.4  更換國內安裝源
  1.5  pip工具安裝Python擴展庫
    1.5.1  pip工具在線更新
    1.5.2  在線安裝擴展庫
    1.5.3  離線安裝擴展庫下載包
  1.6  PyCharm的快捷鍵
第2章  CSV庫及json庫的數據類型轉換
  2.1  本章介紹
  2.2  csv庫的讀/寫方法
  2.3  讀取CSV文件並輸出為列表類型
  2.4  讀取CSV文件並輸出為字典類型
  2.5  以字元串數據類型輸出讀取的CSV文件
  2.6  讀取本地JSON格式文件
  2.7  自定義分隔符寫入CSV文件
第3章  jieba庫中文切詞統計
  3.1  本章介紹
  3.2  jieba庫概述
  3.3  iieba庫語法
    3.3.1  精確模式
    3.3.2  全模式
    3.3.3  搜索引擎模式
  3.4  jieba庫統計詞頻實例
    3.4.1  實例任務要求
    3.4.2  選擇精確模式進行中文切詞
    3.4.3  刪除單字辭彙
    3.4.4  選擇適當數據類型構建辭彙與詞頻的對應關係
    3.4.5  數據類型轉換並排序
    3.4.6  刪除非人物名稱的相關辭彙
    3.4.7  合併同一人物的不同稱謂
    3.4.8  按任務要求調整輸出的數據結構
    3.4.9  統計詞頻程序的完整代碼
第4章  NumPy結合openCV庫進行圖像數據處理
  4.1  本章介紹
  4.2  NumPy庫簡介
    4.2.1  NumPy庫概述
    4.2.2  NumPy庫的特點
    4.2.3  NumPy庫的導入
  4.3  array()創建多維數組
    4.3.1  多維數組概念
    4.3.2  多維數組對象
    4.3.3  數組對象屬性
  4.4  OpenCV庫的簡單圖像處理

    4.4.1  OpencV庫導人、顯示及保存圖像的方法
    4.4.2  NumPy庫多維數組對象屬性與OpenCV庫圖像處理的對應關係
  4.5  創建數組
    4.5.1  創建數組的常用函數
    4.5.2  隨機生成函數random()創建數組
    4.5.3  NumPy圖像處理:創建數組繪製三維圖像
  4.6  定位數組元素
    4.6.1  索引與切片
    4.6.2  NumPy圖像處理:切片數組修改指定的圖像區域
    4.6.3  NumPy圖像處理:切片處理圖像的翻轉、縮小與交換顏色通道
  4.7  簡單數組運算
    4.7.1  多維數組與常量的運算
    4.7.2  相同形狀數組之間的運算
    4.7.3  NumPy圖像處理:彩色圖像轉換為灰度圖
  4.8  數組運算的廣播機制
    4.8.1  廣播機制的原理
    4.8.2  廣播機制的一般規則
    4.8.3  理解廣播的機制
  4.9  修改數組形狀
    4.9.1  np.reshape()函數
    4.9.2  np.resize()函數
    4.9.3  np.transpose()函數與ndarray.T屬性
    4.9.4  np.broadcast_to()函數
    4.9.5  NumPy圖像處理:圖像形狀自動轉換為正方形
  4.10  數組的切分、拼接與堆疊
    4.10.1  數組切分:np.split()、np.hsplit()、np.vsplit()與np.dsplit()
    4.10.2  NumPy圖像處理:切分圖像
    4.10.3  拼接數組:np.concatenate()函數
    4.10.4  NumPy圖像處理:拼接不同顏色通道圖像
    4.10.5  堆疊數組:np.stack()、np.hstack()、np.vstack()與np.dstack()
    4.10.6  NumPy圖像處理:切分、堆疊、交換顏色通道與圖像二值化處理
  4.11  數組的複製與軸變換
    4.11.1  複製數組:np.tile()與np.repeat()
    4.11.2  NumPy圖像處理:複製數組繪製漸變色背景的圓形
    4.11.3  數組軸變換:np.rollaxis()與np.Swapaxes()
    4.11.4  NumPy圖像處理:軸變換旋轉圖像
  4.12  數組的統計與運算函數
    4.12.1  數組的統計函數
    4.12.2  圖像處理中的均值與標準差
    4.12.3  NumPy圖像處理:利用統計函數繪製正態分佈圖像
  4.13  修改數組維度
    4.13.1  擴展維度:expand-dims()
    4.13.2  維度展平:ndarray.flat、ndarray.flatten()與np.ravel()
    4.13.3  刪除維度:np.squeeze()
    4.13.4  NumPy圖像處理:降低圖像維度
  4.14  圖像數組的預處理:去均值與歸一化
    4.14.1  圖像去均值
    4.14.2  像素歸一化
    4.14.3  NumPy圖像處理:歸一化與去均值后的圖像對比分析
    4.14.4  NumPy圖像處理:圖像增加高斯噪點與高斯模糊

  4.15  數組元素的增刪改等操作
    4.15.1  末尾追加元素np.append()
    4.15.2  指定位置插入元素np.insert()
    4.15.3  刪除指定元素np.delete()
    4.15.4  去除重複元素np.unique()
    4.15.5  強制截取並賦值元素np.clip()
第5章  Pandas庫進行結構化數據統計分析
  5.1  本章介紹
  5.2  Pandas庫概述
    5.2.1  Pandas庫簡介
    5.2.2  Pandas庫特點
    5.2.3  Pandas庫導入
  5.3  創建序列pd.Series()
    5.3.1  Series簡介
    5.3.2  創建序列pd.Seties()
  5.4  創建數據表pd.DataFrame()
  5.5  獲取數據對象
    5.5.1  切片獲取列對象或指定區間的行對象
    5.5.2  下標索引屬性df.loc獲取指定區間對象
      5.5.3標籤索引屬性df.loc獲取指定區問對象
  5.6  檢索數據對象
    5.6.1  切片與運算符檢索數據對象
    5.6.2  df.index與df.columns屬性檢索數據對象
    5.6.3  df.isin()與df.query()檢索數據對象
  5.7  增加或修改數據對象
    5.7.1  切片增加或修改列對象
    5.7.2  插入列對象df.inseit()
      5.7.3增加或修改行對象df.loc
    5.7.4  修改行對象df.iloc
  5.8  刪除數據對象
    5.8.1  刪除行或列對象df.drop()
    5.8.2  刪除重複行對象df-rop-duplicates()
  5.9  設置與重置索引
    5.9.1  設置索引df.set_index()
    5.9.2  重置索引df.eset_index()
  5.10  數據分析中空值的處理
    5.10.1  各類語言中的空值None、NaN、NaT、Null與NA
    5.10.2  過濾空值df.dropna()
    5.10.3  填充空值df.fillna()
    5.10.4  判斷空值df.isnull()與df.isna()
  5.11  常見的數據值操作方法
    5.11.1  替換字元串df.replace()
    5.11.2  數據分列pd.Series.str.split()
    5.11.3  刪除前後指定字元pd.Series.str.strip()
  5.12  Pandas的日期時間處理
    5.12.1  日期列轉換與組合pd.to-datetime()
    5.12.2  日期列提取Series.dt()
    5.12.3  日期索引範圍設定pd.date-range()
    5.12.4  周期索引範圍設定pd.period-range()
    5.12.5  時間運算pd.Timestamp()與pd.Timedelta()

    5.12.6  周期移位df.shift()
  5.13  函數統計與運算
    5.13.1  常見聚合統計函數
    5.13.2  統計應用函數df.apply()
    5.13.3  聚合應用函數df.agg()
    5.13.4  非聚合應用函數df.transforom()
    5.13.5  df.apply()、df.agg()與df.transform()對比分析
  5.14  分組統計與排序
    5.14.1  分組統計df.grOLlpby()語法
    5.14.2  分組統計應用
    5.14.3  數據對象的值排序df.Sol-valLleS()
    5.14.4  索引排序df.soi-Index()
    5.14.5  計算排名df.rank()
  5.15  連接與合併數據對象
    5.15.1  相同數據結構表拼接pd.concat()
    5.15.2  指定軸上的表合併pd.meige()
    5.15.3  行索引上的表連接df.join()
    5.15.4  縱向追加表數據df-append()
    5.15.5  連接與合併函數的功能對比
  5.16  Pandas讀取外部文件
  5.17  高階函數eval()的列運算
    5.17.1  evaI()函數簡介
    5.17.2  pd.eval()實現多表列運算
    5.17.3  df.eval實現單表列運算
第6章  Pyecharts庫實現在線數據可視化
  6.1  本章介紹
  6.2  Pyecharts庫概述
    6.2.1  Pyecharts庫簡介
    6.2.2  Pyecharts庫特性
    6.2.3  Pyecharts庫導入
  6.3  ECharts繪圖簡介
    6.3.1  ECharts繪圖簡介
    6.3.2  ECharts特性
    6.3.3  ECharts配置項
  6.4  Pyecharts簡單繪圖
  6.5  opt。ions配置項
    6.5.1  設置全局配置項set-global-opts()
    6.5.2  設置系列配置項set-series-opts()
  6.6  參數的傳遞
  6.7  數據格式轉換
  6.8  鏈式調用
  6.9  使用主題
  6.10  Pyecharts繪製橫向折線與散點子圖
  6.11  繪製並行多圖Grid()與順序多圖Page()
    6.11.1  繪製並行多圖Grid()
    6.11.2  繪製順序多圖Page()
  6.12  繪製餅圖(南丁格爾玫瑰圖)
  6.13  Python中嵌入JS程序運行
    6.13.1  調用JavaScript程序方法
    6.13.2  查找適用於JsCode的參數

    6.13.3  Python程序中嵌入JS程序運行
    6.13.4  fake數據集的導入和使用
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032