幫助中心 | 我的帳號 | 關於我們

Python數據分析全流程實操指南

  • 作者:編者:尚濤|責編:張雲靜//吳秀川
  • 出版社:北京大學
  • ISBN:9787301289495
  • 出版日期:2020/09/01
  • 裝幀:平裝
  • 頁數:342
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書基於Python3.7版本軟體編寫,全書主要圍繞整個數據分析方法論的標準流程,為讀者重點展示了Python在數據獲取、數據處理、數據探索、數據分析及數據可視化等領域的應用技術。
    本書首先介紹了數據分析的方法論,給讀者介紹了具體的數據分析挖掘標準流程,接著介紹了Python常用的工具包,包括科學計算庫NumPy、數據分析庫Pandas、數據挖掘庫Scikit-Learn,以及數據可視化庫Matplotlib和Seaborn的基本知識,並從數據分析挖掘過程中的數據獲取、數據處理、數據探索等實際業務應用出發,以互聯網、金融及零售等行業真實案例,比如客戶分群、產品精準營銷、房價預測、特徵降維等,深入淺出、循序漸進地介紹Python數據分析的全過程。
    本書內容精練、重點突出、案例豐富,實踐性和指導性極強,值得一讀,特別適合在企業中從事數據分析、數據挖掘、機器學習、運營分析等工作的人員使用,同樣適合想從事數據分析挖掘工作的各大中專院校的學生與教師,以及其他對數據分析挖掘技術領域有興趣愛好的各類人員使用。

作者介紹
編者:尚濤|責編:張雲靜//吳秀川
    尚濤,畢業於上海交通大學數學系,擁有數學碩士學位,研究方向為數據挖掘與機器學習應用領域,曾任職于支付寶、易方達基金等頭部企業,現任職于南方基金,專註于精準營銷、推薦系統、風險評分以及數據化運營等領域的研發工作,擁有超過10年數據挖掘和優化建模的經驗,以及多年使用SAS、R、Python等軟體的經驗,在從業經歷中,為所在公司的業務方成功實施了眾多深受好評的數據挖掘項目,取得了較好的業務價值。

目錄
第一章  數據分析方法
  1.1  什麼是數據分析
  1.2  數據分析標準流程
  1.3  數據清洗
  1.4  數據探索
  1.5  模型開發
  1.6  模型應用
第二章  初識Python
  2.1  Python基本概述
  2.2  Python編程語法基礎
  2.3  數據分析常用Python庫
  2.4  第三方Python庫介紹
第三章  NumPy數組與矩陣
  3.1  Ndarray對象
  3.2  數據類型
  3.3  數組屬性
  3.4  創建數組
  3.5  數據索引與切片
  3.6  數組操作
  3.7  數組排序
  3.8  函數
  3.9  矩陣
第四章  Pandas數據分析
  4.1  系列(Series)
  4.2  數據幀(DataFrame)
  4.3  基本功能介紹
  4.4  讀取和寫入數據
  4.5  索引和選擇數據
  4.6  數據合併
  4.7  累計與分組
  4.8  時間序列處理
  4.9  缺失數據處理
  4.10  函數
  4.11  描述性統計
  4.12  繪製圖形
第五章  Scikit-Learn數據挖掘
  5.1  機器學習問題
  5.2  機器學習的基本流程
  5.3  數據處理
  5.4  特徵選擇
  5.5  模型調用
  5.6  模型參數說明
  5.7  交叉驗證
  5.8  模型部署
第六章  數據可視化
  6.1  Matplotlib繪製圖形
  6.2  Seaborn繪製圖形
  6.3  重要類型圖形的繪製
第七章  數據導入與導出
  7.1  連接資料庫

  7.2  讀取外部數據
  7.3  導出數據
第八章  數據預處理
  8.1  數據去重
  8.2  缺失值處理
  8.3  變數操作
  8.4  樣本選擇
  8.5  數據集操作
第九章  數據探索
  9.1  集中趨勢
  9.2  離散程度
  9.3  分佈狀態
  9.4  相關分析
第十章  線性回歸分析
  10.1  線性回歸模型
  10.2  最小二乘估計
  10.3  顯著性檢驗
  10.4  預測
  10.5  相關性
  10.6  共線性
  10.7  案例分析——波士頓地區房價預測
第十一章  Logistic回歸分析
  11.1  邏輯回歸模型介紹
  11.2  案例分析——泰坦尼克生存預測
第十二章  決策樹
  12.1  決策樹介紹
  12.2  案例分析——金融產品推薦
第十三章  主成分分析
  13.1  主成分分析的數學模型
  13.2  PCA函數說明
  13.3  案例分析——數據降維
第十四章  聚類分析
  14.1  距離
  14.2  聚類方法
  14.3  確定聚類數
  14.4  聚類的分析步驟
  14.5  案例分析——客戶群聚類分析
第十五章  時間序列分析
  15.1  時間序列的組成部分
  15.2  確定性的時間序列模型
  15.3  隨機時間序列模型
  15.4  ARMA模型的識別
  15.5  時間序列的分析步驟
  15.6  模型參數的估計
  15.7  案例分析——大氣二氧化碳濃度預測

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032