幫助中心 | 我的帳號 | 關於我們

數據分析與可視化/新工科建設之路數據科學與大數據系列

  • 作者:編者:張玉宏|責編:孟宇
  • 出版社:電子工業
  • ISBN:9787121450044
  • 出版日期:2023/02/01
  • 裝幀:平裝
  • 頁數:398
人民幣:RMB 99.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    數據分析與可視化在大數據時代扮演著重要角色。數據分析用於將原始數據轉化為可行的見解,可視化能將關鍵數據和特徵直觀地表達出來。本書深入淺出地介紹了數據分析與可視化的相關理論和實踐,全書共7章。第1章闡明NumPy的基礎操作。第2章詳細介紹NumPy的高級應用,內容包括數組的高級索引方式、張量的合併與分割、NumPy文件的讀與寫。第3章介紹Pandas的基本特性。第4章詳細闡述Pandas的高級特性。第5章詳細討論可視化工具Matplotlib的用法。第6章介紹高階可視化工具Seaborn的用法。第7章講解時間序列數據的處理。每個章節均給出了可用性強的實戰項目。
    本書結構完整、行文流暢,是一本圖文並茂、通俗易懂的數據分析與可視化的零基礎入門著作。對於電腦、大數據、人工智慧及相關專業的本科生和研究生,這是一本適合入門與系統學習的教材;對於從事數據分析與可視化的工程技術人員,本書亦有很高的參考價值。

作者介紹
編者:張玉宏|責編:孟宇

目錄
第1章  NumPy數值計算基礎
  1.1  為何還需NumPy
  1.2  如何安裝和導入NumPy
  1.3  N維數組的本質
    1.3.1  NumPy數組的兩種視圖
    1.3.2  數組的常用屬性
  1.4  如何生成NumPy數組
    1.4.1  利用序列生成
    1.4.2  利用特定方法生成
    1.4.3  利用其他常用方法
  1.5  NumPy中的隨機數生成
  1.6  NumPy數組中的運算
    1.6.1  向量運算
    1.6.2  NumPy中的通用函數
    1.6.3  逐元素運算與點乘運算
    1.6.4  向量的內積與矩陣乘法
  1.7  NumPy中的廣播機制
    1.7.1  廣播的本質
    1.7.2  「低維有1」情況下的廣播
    1.7.3  「后緣相符」情況下的廣播
    1.7.4  「后緣不符但低維有1」情況下的廣播
  1.8  NumPy中的軸
    1.8.1  認識軸的概念
    1.8.2  基於軸的約減操作
    1.8.3  基於軸的各種運算
  1.9  操作數組元素
    1.9.1  通過索引訪問數組元素
    1.9.2  NumPy中的切片訪問
    1.9.3  二維數組的轉置與展平
  1.10  實戰:張量思維的養成——利用NumPy計算π
  1.11  本章小結
  1.12  思考與提高
第2章  NumPy數值計算進階
  2.1  NumPy數組的高級索引
    2.1.1  花式索引
    2.1.2  好用的布爾索引
  2.2  張量的堆疊操作與分割
    2.2.1  水平方向堆疊hstack
    2.2.2  垂直方向堆疊vstack
    2.2.3  深度方向堆疊dstack
    2.2.4  張量的分割操作
  2.3  NumPy張量的升維與降維
  2.4  數據的去重與鋪疊
    2.4.1  用unique去重
    2.4.2  用tile鋪疊數據
  2.5  張量的排序
    2.5.1  數值排序
    2.5.2  按列名(order)排序
    2.5.3  多序列排序(lexsort)
    2.5.4  索引排序(argsort)

    2.5.5  索引優選值(argmax)與最小值(argmin)
  2.6  常用的統計方法
    2.6.1  優選值、最小值與極值區間
    2.6.2  均值、中位數、百分數與方差
    2.6.3  眾數與堆統計
  2.7  NumPy文件的讀與寫
    2.7.1  二進位文件的讀與寫
    2.7.2  文本文件的讀與寫
    2.7.3  CSV文件的讀與寫
  2.8  基於NumPy的綜合實踐
    2.8.1  鳶尾花數據集的統計分析
    2.8.2  電力負荷數據的處理
  2.9  本章小結
  2.10  思考與練習
第3章  Pandas數據分析初步
  3.1  Pandas簡介與安裝
  3.2  Series類型數據
    3.2.1  Series的創建
    3.2.2  索引訪問與重建索引
    3.2.3  通過字典構建Series
    3.2.4  Series中數據的選擇
    3.2.5  向量化操作
    3.2.6  布爾索引
    3.2.7  切片訪問
    3.2.8  數值的刪除
    3.2.9  數值的添加
  3.3  DataFrame類型數據
    3.3.1  構建DataFrame
    3.3.2  訪問DataFrame中的列與行
    3.3.3  DataFrame的刪除操作
    3.3.4  添加行與列
  3.4  基於Pandas的文件讀取與分析
    3.4.1  讀取CSV文件——以工資信息表為例
    3.4.2  DataFrame中的常用屬性
    3.4.3  DataFrame中的常用方法
    3.4.4  DataFrame的條件過濾
    3.4.5  DataFrame的切片操作
    3.4.6  DataFrame的排序操作
  3.5  實戰:讀取Excel文件——以電力負荷數據為例
    3.5.1  數據源參數
    3.5.2  特定表單參數
    3.5.3  表頭讀數
    3.5.4  表頭名稱參數
    3.5.5  索引列參數
    3.5.6  解析列參數
    3.5.7  數據轉換參數
  3.6  本章小結
  3.7  思考與練習
第4章  Pandas數據預處理與深加工
  4.1  數據清洗

    4.1.1  缺失值標記與檢測
    4.1.2  檢測形式各異的缺失值
    4.1.3  缺失值的刪除
    4.1.4  缺失值的填充
  4.2  數據的標準化
    4.2.1  MAX-MIN歸一化
    4.2.2  零均值標準化
  4.3  數據變換與數據離散化
    4.3.1  類別型數據的啞變數處理
    4.3.2  連續型變數的離散化
  4.4  函數的映射與應用
    4.4.1  map函數的使用
    4.4.2  apply函數的使用
    4.4.3  applymap函數的使用
  4.5  索引的高階應用
    4.5.1  重建索引
    4.5.2  設置索引
    4.5.3  重置索引
    4.5.4  分層索引
    4.5.5  實戰:《指環王》台詞數量分析
  4.6  數據的融合與堆疊
    4.6.1  merge按鍵數據融合
    4.6.2  concat按軸堆疊數據
    4.6.3  append數據項追加
  4.7  數據的聚合和分組操作
    4.7.1  聚合操作
    4.7.2  分組與聚合
    4.7.3  分組與轉換
  4.8  數據重塑與透視
    4.8.1  數據重塑
    4.8.2  數據透視
    4.8.3  實戰:《指環王》中的透視表
  4.9  實戰:泰坦尼克倖存者數據預處理分析
    4.9.1  數據簡介
    4.9.2  數據探索
    4.9.3  缺失值處理
  4.10  本章小結
  4.11  思考與練習
第5章  Matplotlib可視化分析
  5.1  可視化與Matplot
  5.2  Matplot繪製簡單圖形
  5.3  pyplot的常用方法
    5.3.1  添加圖例與註釋
    5.3.2  設置(中文)標題及坐標軸
    5.3.3  添加網格線
    5.3.4  繪製多個子圖
    5.3.5  Axes與subplot的區別
    5.3.6  圖形的填充
  5.4  折線圖
  5.5  散點圖

  5.6  條形圖與直方圖
    5.6.1  垂直條形圖
    5.6.2  水平條形圖
    5.6.3  並列條形圖
    5.6.4  直方圖
  5.7  餅狀圖
  5.8  箱形圖
  5.9  誤差條
  5.10  實戰:谷歌流感趨勢數據可視化分析
    5.10.1  谷歌流感趨勢數據描述
    5.10.2  導入數據與數據預處理
    5.10.3  繪製時序曲線圖
    5.10.4  選擇合適的數據可視化表達
    5.10.5  基於條件判斷的圖形繪製
    5.10.6  繪製多個子圖
  5.11  本章小結
  5.12  思考與提高
第6章  可視化分析進階
  6.1  絢麗多姿的Seaborn
    6.1.1  Matplotlib與Seaborn對比
    6.1.2  Seaborn的樣式設置
    6.1.3  設置應用模式與繪圖元素縮放比例
    6.1.4  使用despine方法進行邊框控制
    6.1.5  使用axes_style方法設置子圖風格
  6.2  Seaborn中的常用繪圖
    6.2.1  回歸圖
    6.2.2  對圖
    6.2.3  密度圖
    6.2.4  直方圖
    6.2.5  熱力圖
    6.2.6  箱形圖
    6.2.7  小提琴圖
  6.3  手繪風格的繪圖
    6.3.1  手繪曲線
    6.3.2  手繪柱狀圖
    6.3.3  在手繪圖中添加中文卡通字體
    6.3.4  手繪餅狀圖
  6.4  實戰:泰坦尼克倖存者數據可視化分析
    6.4.1  導入數據
    6.4.2  繪製倖存者情況
    6.4.3  繪製乘客的其他信息
  6.5  本章小結
  6.6  思考與練習
第7章  時間序列數據分析
  7.1  時間序列數據概述
  7.2  日期和時間數據類型
    7.2.1  datetime模塊
    7.2.2  datetime轉換為timestamp
    7.2.3  datetime轉換為str
    7.2.4  datetime的加與減

    7.2.5  NumPy中的日期模塊
  7.3  時間序列對象的構建與切片
    7.3.1  時間序列構造
    7.3.2  時間索引與切片
  7.4  日期範圍、頻率和移位
    7.4.1  日期範圍
    7.4.2  時間頻率
    7.4.3  時間序列的移位操作
  7.5  時期的表示
    7.5.1  時期的創建與運算
    7.5.2  頻率轉換
    7.5.3  時期與周期的轉換
  7.6  時間滑動窗口
  7.7  重採樣、降採樣和升採樣
    7.7.1  重採樣
    7.7.2  降採樣中的常用參數
    7.7.3  升採樣中的缺失值填充
  7.8  實戰:面向股票數據的時間序列分析
    7.8.1  股票數據的獲取
    7.8.2  設置百日滾動均線
    7.8.3  繪製價格與成交量子圖
    7.8.4  股票數據的K線圖繪製
  7.9  本章小結
  7.10  思考與練習

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032