幫助中心 | 我的帳號 | 關於我們

大數據分析方法及應用--基於Python實現(面向新工科高等院校大數據專業系列教材)

  • 作者:編者:殷麗鳳//王斐|責編:解芳//章承林
  • 出版社:機械工業
  • ISBN:9787111782919
  • 出版日期:2025/08/01
  • 裝幀:平裝
  • 頁數:288
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書全面且系統地闡述了基於Python語言的大數據分析方法及技術,整體結構緊湊,邏輯清晰。全書共10章,前5章旨在為讀者打下堅實的理論與實踐基礎。該部分始於大數據的基本概念,隨後逐步深入Python基礎知識、數據預處理技術、大數據可視化手段及基於Python的數據處理與預處理技術,確保讀者能夠全面掌握數據分析所需的基本工具與方法。后5章則深入探索大數據分析的核心技術領域,涵蓋關聯分析、回歸分析、分類分析、聚類分析及離群點分析等關鍵內容。全書每一章均配有精心設計的典型案例與Python代碼實例,通過實戰演練的形式,直觀展現大數據分析原理在實際中的具體運用,讀者在鞏固理論知識的同時,能夠親身體驗實際操作過程,進而深化對大數據分析流程的理解與認識。
    本書在內容的專業性與閱讀體驗之間取得了良好的平衡,既可作為高校大數據技術課程的教材,也適合大數據技術愛好者進行自學。無論讀者是初學者,還是已具備一定基礎的從業者,本書均能提供寶貴的啟示與實用的知識,助力讀者在大數據分析的道路上不斷前行。

作者介紹
編者:殷麗鳳//王斐|責編:解芳//章承林

目錄
前言
第1章  大數據分析概述
  1.1  大數據介紹
    1.1.1  大數據概念
    1.1.2  大數據的5個「V」
    1.1.3  大數據的處理方法
  1.2  大數據關鍵技術
    1.2.1  數據採集
    1.2.2  數據預處理
    1.2.3  數據存儲與管理
    1.2.4  數據分析與挖掘
    1.2.5  數據展現與可視化
  1.3  大數據分析在不同領域的應用
    1.3.1  商業與市場營銷
    1.3.2  醫療與健康
    1.3.3  金融與保險
    1.3.4  社交網路與媒體
  1.4  Python介紹
    1.4.1  安裝Python解釋器
    1.4.2  安裝PyCharm
    1.4.3  安裝 Anaconda
  1.5  本章小結
  1.6  習題
第2章  Python大數據分析基礎
  2.1  Python基礎語法
    2.1.1  關鍵字和標識符
    2.1.2  常量與變數
    2.1.3  基本數據類型
    2.1.4  運算符和表達式
  2.2  程序控制結構
    2.2.1  順序結構
    2.2.2  分支結構
    2.2.3  循環結構
    2.2.4  跳轉語句
  2.3  組合數據類型
    2.3.1  列表
    2.3.2  元組
    2.3.3  字典
    2.3.4  集合
  2.4  函數
    2.4.1  函數的定義
    2.4.2  函數的參數
    2.4.3  函數的作用域
    2.4.4  遞歸函數
  2.5  面向對象程序設計
    2.5.1  Python中的面向對象
    2.5.2  成員可見性
    2.5.3  方法
    2.5.4  類的繼承
  2.6  Python數據分析工具

  2.7  本章小結
  2.8  習題
第3章  大數據預處理
  3.1  大數據預處理流程
  3.2  數據清洗
    3.2.1  缺失值處理
    3.2.2  雜訊過濾
  3.3  數據集成
    3.3.1  實體識別
    3.3.2  冗余屬性識別
  3.4  數據規約
    3.4.1  屬性規約
    3.4.2  數值規約
  3.5  數據變換
    3.5.1  數據規範化
    3.5.2  連續屬性離散化
  3.6  本章小結
  3.7  習題
第4章  大數據可視化分析
  4.1  大數據可視化基礎
    4.1.1  可視化的重要性
    4.1.2  可視化設計原則
  4.2  Matplotlib基礎——NumPy
    4.2.1  創建數組
    4.2.2  數組的常見屬性
    4.2.3  數組的常見操作
    4.2.4  數組的統計分析
  4.3  Matplotlib
    4.3.1  pyplot繪圖基礎
    4.3.2  繪製散點圖
    4.3.3  繪製折線圖
    4.3.4  繪製柱狀圖
    4.3.5  繪製直方圖
    4.3.6  繪製餅圖
    4.3.7  繪製箱線圖
  4.4  實踐——中國GDP分析
    4.4.1  數據準備
    4.4.2  散點圖分析
    4.4.3  折線圖分析
    4.4.4  柱狀圖分析
    4.4.5  餅圖分析
    4.4.6  箱線圖分析
  4.5  本章小結
  4.6  習題
第5章  pandas數據處理與分析
  5.1  認識pandas
    5.1.1  pandas簡介
    5.1.2  pandas的安裝與使用
  5.2  pandas語法
    5.2.1  Series類型

    5.2.2  DataFrame類型
    5.2.3  DataFrame數據計算
  5.3  pandas讀寫數據
    5.3.1  pandas讀數據
    5.3.2  pandas寫數據
  5.4  使用pandas進行數據預處理
    5.4.1  合併數據
    5.4.2  缺失值處理
    5.4.3  排序和匯總
  5.5  統計分析
    5.5.1  分組聚合運算
    5.5.2  創建透視表與交叉表
  5.6  本章小結
  5.7  習題
第6章  關聯分析
  6.1  關聯分析基礎
    6.1.1  啤酒與尿布的故事
    6.1.2  關聯分析的定義
    6.1.3  常用關聯分析演算法
  6.2  Apriori演算法
    6.2.1  相關概念
    6.2.2  挖掘頻繁項集
    6.2.3  挖掘關聯規則
    6.2.4  Apriori演算法的缺點
  6.3  FP-growth演算法
    6.3.1  創建FP樹
    6.3.2  利用FP樹挖掘頻繁項集
    6.3.3  FP-growth演算法的偽代碼
  6.4  ECLAT演算法
    6.4.1  使用垂直數據格式挖掘頻繁項集
    6.4.2  ECLAT演算法的偽代碼
  6.5  關聯規則評估指標
  6.6  實踐——商品零售購物籃分析
    6.6.1  背景與挖掘目標
    6.6.2  數據初步探析
    6.6.3  構建關聯分析模型
    6.6.4  評估關聯分析模型
  6.7  本章小結
  6.8  習題
第7章  回歸分析
  7.1  回歸分析的基礎
    7.1.1  回歸分析的概念
    7.1.2  回歸分析的步驟
  7.2  一元線性回歸
    7.2.1  一元線性回歸模型
    7.2.2  參數w和b的推導過程
    7.2.3  參數w和b求解的代碼實現
  7.3  多元線性回歸
    7.3.1  多元線性回歸模型和參數求解
    7.3.2  參數W求解的代碼實現

  7.4  正則化回歸
    7.4.1  嶺回歸模型
    7.4.2  最小絕對收縮與選擇運算元
    7.4.3  彈性網路
  7.5  回歸模型的評價指標
  7.6  實踐——回歸分析
    7.6.1  數據的初步探析
    7.6.2  利用一元線性回歸預測房屋完成單位數量模型
    7.6.3  利用多元線性回歸預測房屋完成單位數量模型
    7.6.4  利用正則化回歸預測房屋完成單位數量模型
  7.7  本章小結
  7.8  習題
第8章  分類分析
  8.1  分類分析的基礎
    8.1.1  二元分類和多元分類
    8.1.2  分類的步驟
  8.2  決策樹
    8.2.1  決策樹歸納
    8.2.2  屬性選擇度量
    8.2.3  實例分析
    8.2.4  樹剪枝處理
  8.3  貝葉斯分類
    8.3.1  相關概念
    8.3.2  樸素貝葉斯分類器
    8.3.3  樸素貝葉斯實例分析
    8.3.4  拉普拉斯修正
    8.3.5  樸素貝葉斯演算法偽代碼
  8.4  支持向量機
    8.4.1  數據線性可分情況
    8.4.2  最大邊緣超平面
    8.4.3  硬間隔支持向量機
    8.4.4  軟間隔支持向量機
    8.4.5  核支持向量機
  8.5  分類的評價指標
    8.5.1  二元分類的評價指標
    8.5.2  多元分類的評價指標
  8.6  實踐——分類分析
    8.6.1  利用決策樹構建銀行客戶流失模型
    8.6.2  利用樸素貝葉斯構建垃圾郵件分類模型
    8.6.3  利用SVM構建印第安人糖尿病分類模型
  8.7  本章小結
  8.8  習題
第9章  聚類分析
  9.1  聚類分析基礎
    9.1.1  聚類分析的概念
    9.1.2  相似性度量
    9.1.3  聚類的評價指標
  9.2  基於劃分的聚類分析
    9.2.1  K-Means聚類
    9.2.2  K-Means++聚類

  9.3  基於層次的聚類分析
    9.3.1  自底向上聚類演算法
    9.3.2  自頂向下聚類演算法
  9.4  基於密度的聚類分析
    9.4.1  DBSCAN演算法
    9.4.2  OPTICS演算法
  9.5  實踐——聚類分析
    9.5.1  基於劃分聚類實現能源效率信息聚類
    9.5.2  基於層次聚類完成用戶行為數據聚類
    9.5.3  利用DBSCAN進行人口信息聚類
  9.6  本章小結
  9.7  習題
第10章  離群點分析
  10.1  離群點分析基礎
    10.1.1  離群點分析的定義
    10.1.2  離群點分析的作用
  10.2  基於統計的離群點分析
    10.2.1  均值與標準差方法
    10.2.2  箱線圖方法
  10.3  基於距離的離群點分析
    10.3.1  歐氏距離
    10.3.2  曼哈頓距離
  10.4  基於密度的離群點分析
    10.4.1  局部離群因子(LOF)方法
    10.4.2  基於密度的空間聚類(DBSCAN)方法
  10.5  實踐——異常小麥種子分析
    10.5.1  數據讀入
    10.5.2  數據初步分析
    10.5.3  數據預處理
    10.5.4  構建離群點模型
    10.5.5  評估離群點模型
    10.5.6  離群點分析的意義
  10.6  本章小結
  10.7  習題
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032