幫助中心 | 我的帳號 | 關於我們

Python數據挖掘實踐(高等學校數據科學與大數據技術專業系列教材)

  • 作者:編者:魯江坤//汪林林|責編:馬凡//雷鴻俊
  • 出版社:西安電子科大
  • ISBN:9787560657899
  • 出版日期:2021/01/01
  • 裝幀:平裝
  • 頁數:232
人民幣:RMB 35 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以Python 3.8.1為工具,借助Pycharm開發平台和Anaconda3完成數據分析與挖掘實踐。全書分為兩個部分:第一部分為理論篇,包括第1?5章,介紹數據挖掘、Python、網路爬蟲、數據探索與數據預處理、數據挖掘演算法等基礎知識,每個知識點均有案例支持,為後續數據挖掘奠定實踐基礎;第二部分為實踐篇,包括第6?10章,介紹決策樹預測NBA獲勝球隊、航空公司客戶價值分析、商業零售行業中的購物籃分析、數據挖掘在中文文本分類中的應用和重慶市主城區二手房可視化分析,以網路爬蟲為切入點引入數據集,以常用數據挖掘演算法應用為主線進行數據挖掘實踐。
    本書內容翔實,案例豐富,既可作為應用型本科及高職高專大數據、電腦等相關專業的教材,亦可供Python數據挖掘愛好者自學使用。

作者介紹
編者:魯江坤//汪林林|責編:馬凡//雷鴻俊

目錄
第一部分  理論篇
  第1章  數據挖掘概述
    1.1  數據挖掘的概念
    1.2  數據挖掘的基本任務
    1.3  數據挖掘建模過程
      1.3.1  定義挖掘目標
      1.3.2  數據採集與抽樣
      1.3.3  數據探索
      1.3.4  數據預處理
      1.3.5  數據挖掘建模
      1.3.6  模型評價
    1.4  常用數據挖掘工具
    1.5  數據挖掘現狀及應用前景
    本章小結
  第2章  Python概述
    2.1  初識Python
      2.1.1  Python的版本
      2.1.2  Python的應用領域
    2.2  搭建Python開發環境
      2.2.1  下載與安裝Python
      2.2.2  下載與安裝PyCharm
      2.2.3  下載與安裝Anaconda
    2.3  基於Python編寫簡單案例
    2.4  Python中與數據挖掘相關的第三方庫
      2.4.1  Numpy
      2.4.2  Scipy
      2.4.3  Matplotlib
      2.4.4  Pandas
      2.4.5  StatsModels
      2.4.6  Scikit.Learn
    本章小結
  第3章  Python快速入門
    3.1  數據結構及方法
      3.1.1  列表
      3.1.2  元組
      3.1.3  字典
    3.2  控制流
      3.2.1  if分支
      3.2.2  for循環
      3.2.3  while循環
    3.3  字元串處理方法
      3.3.1  字元串的常用方法
      3.3.2  正則表達式
    3.4  自定義函數
      3.4.1  自定義函數語法
      3.4.2  自定義函數的幾種參數
    3.5  網路爬蟲的原理
      3.5.1  理論概述
      3.5.2  爬蟲的工作流程
    3.6  爬蟲所用庫及框架介紹

      3.6.1  Requests庫介紹及用法
      3.6.2  BeautifulSoup庫介紹及用法
      3.6.3  Re庫介紹
    3.7  網路爬蟲的設計與實現
      3.7.1  網路爬蟲的總體設計
      3.7.2  網路爬蟲具體實現過程
      3.7.3  爬蟲結果
    本章小結
  第4章  數據探索與數據預處理
    4.1  數據探索核心內容
      4.1.1  數據質量分析
      4.1.2  數據特徵分析
      4.1.3  Python主要探索函數
    4.2  數據預處理核心內容
      4.2.1  數據清洗
      4.2.2  數據變換
      4.2.3  數據規約
      4.2.4  Python主要的數據預處理函數
    本章小結
  第5章  常用數據挖掘演算法
    5.1  分類與預測演算法
      5.1.1  分類與預測演算法概述
      5.1.2  分類與預測演算法實現過程
      5.1.3  決策樹演算法
      5.1.4  貝葉斯分類
      5.1.5  人工神經網路
      5.1.6  分類與預測演算法評價
    5.2  聚類分析演算法
      5.2.1  聚類分析演算法概述
      5.2.2  K.Means演算法
      5.2.3  聚類分析演算法評價
    5.3  關聯規則演算法
      5.3.1  關聯規則演算法概述
      5.3.2  Apriori演算法
  本章小結
第二部分  實踐篇
  第6章  決策樹預測NBA獲勝球隊
    6.1  載入數據集
      6.1.1  使用網路爬蟲採集數據
      6.1.2  用Pandas載入數據集
      6.1.3  NBA球賽數據清洗
      6.1.4  提取新特徵
    6.2  決策樹應用
      6.2.1  決策樹中的參數
      6.2.2  使用決策樹
    6.3  NBA比賽結果預測
    6.4  隨機森林
      6.4.1  決策樹的集成效果
      6.4.2  隨機森林演算法的參數
      6.4.3  使用隨機森林演算法

      6.4.4  創建新特徵
    本章小結
  第7章  航空公司客戶價值分析
    7.1  背景與挖掘目標
    7.2  案例建模流程
    7.3  航空公司數據載入
      7.3.1  數據抽取
      7.3.2  數據探索分析
    7.4  航空公司數據預處理
    7.5  航空公司模型構建
    本章小結
  第8章  商業零售行業中的購物籃分析
    8.1  背景與挖掘目標
    8.2  載入商業零售數據集
    8.3  商業零售數據預處理
    8.4  初步探索數據
      8.4.1  查看各數據項的取值
      8.4.2  性別和婚姻狀況
      8.4.3  年齡
      8.4.4  職業
      8.4.5  居住時間
      8.4.6  城市
    8.5  二次探索數據
      8.5.1  暢銷產品
      8.5.2  年齡與產品類型的關係
      8.5.3  居住時間與產品類型的關係
      8.5.4  性別、婚姻狀況與產品類型的關係
      8.5.5  城市與產品類型的關係
    8.6  構建隨機森林模型
      8.6.1  特徵工程
      8.6.2  模型訓練
      8.6.3  模型優化
    本章小結
  第9章  數據挖掘在中文文本分類中的應用
    9.1  背景與挖掘目標
    9.2  載入文本分類數據集
      9.2.1  待載入數據集
      9.2.2  載入文本數據
      9.2.3  文本分類數據清洗
      9.2.4  提取新特徵與文本向量化表示
    9.3  文本分類模型構建
    9.4  Python編程實現
    本章小結
  第10章  重慶市主城區二手房可視化分析
    10.1  背景與挖掘目標
    10.2  數據採集與數據清洗
      10.2.1  數據採集
      10.2.2  數據清洗
    10.3  數據可視化分析
      10.3.1  主城區二手房數據載入

      10.3.2  數據整體質量分析
      10.3.3  重慶主城區二手房基本信息可視化分析
      10.3.4  重慶主城區二手房房屋屬性可視化分析
    10.4  主城區二手房模型構建
      10.4.1  K值的選定
      10.4.2  初始的K個質心選定
      10.4.3  離群點處理
      10.4.4  數據的標準化
      10.4.5  聚類結果分析
    本章小結
  參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032