幫助中心 | 我的帳號 | 關於我們

Python數據處理分析可視化與數據化運營(高等院校十三五規劃教材)/Python系列

  • 作者:編者:宋天龍|責編:孫燕燕
  • 出版社:人民郵電
  • ISBN:9787115527592
  • 出版日期:2020/09/01
  • 裝幀:平裝
  • 頁數:234
人民幣:RMB 49.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書的編寫主要圍繞Python在企業中的數據分析工作實踐,著眼于構建完整的數據分析框架、方法和技能的培養和訓練。全書共10章,其中第1章和第2章介紹了進行Python數據分析的準備工作和Python基礎知識;第3?9章介紹了數據對象的讀寫、數據清洗和預處理、數據可視化、基本數據統計分析和高級數據建模分析、自然語言理解和文本挖掘、數據分析部署和應用等完整工作技能和方法;第10章介紹了數據分析在數據化運營中的完整應用思路、維度和框架。本書內容深入淺出,均以企業真實需求引導學習,具有很強的實用性和操作性。
    本書可以作為普通高等院校本科、專科統計、商務分析、大數據等專業的課程教材,也可以作為從事數據分析工作的人員的參考用書。

作者介紹
編者:宋天龍|責編:孫燕燕

目錄
第1章  認識Python
  1.1  Python與數據分析
    1.1.1  Python的概念
    1.1.2  數據分析與Python
  1.2  如何準備Python程序環境
    1.2.1  如何安裝Python程序
    1.2.2  如何安裝第三方庫
  1.3  Python數據分析庫
    1.3.1  Pandas
    1.3.2  Scipy
    1.3.3  Numpy
    1.3.4  Scikit-Learn
    1.3.5  Statsmodels
    1.3.6  Gensim
  1.4  Python交互環境Jupyter
    1.4.1  啟動Jupyter
    1.4.2  Jupyter的功能區
    1.4.3  Jupyter的常用操作
    1.4.4  Jupyter的魔術命令
    1.4.5  Jupyter的配置
  1.5  執行第一個Python程序
  1.6  新手常見誤區
    1.6.1  隨意升級庫到最新版本
    1.6.2  糾結于使用Python2還是Python3
    1.6.3  糾結于選擇32位還是64位版本
  實訓:列印自己的名字
  思考與練習
第2章  Python語言基礎
  2.1  基礎規則
    2.1.1  Python解釋器
    2.1.2  編碼聲明
    2.1.3  縮進和執行域
    2.1.4  長語句斷行
    2.1.5  單行和多行註釋
    2.1.6  變數的命名和賦值規則
  2.2  數據類型
    2.2.1  數字型數據
    2.2.2  字元型數據
    2.2.3  日期型數據
    2.2.4  數據類型的判斷與轉換
  2.3  數據結構
    2.3.1  列表和列表推導式
    2.3.2  元組和元組推導式
    2.3.3  字典和字典推導式
    2.3.4  集合和集合推導式
    2.3.5  數據結構的判斷與轉換
  2.4  條件表達式與判斷
    2.4.1  單層條件判斷
    2.4.2  嵌套條件判斷
    2.4.3  多條件判斷中的and和or

    2.4.4  多條件判斷中的鏈式比較、all和any
    2.4.5  基於條件表達式的賦值
  2.5  循環和流程式控制制
    2.5.1  for循環和條件表達式
    2.5.2  while循環和條件表達式
    2.5.3  循環嵌套
    2.5.4  無限循環
    2.5.5  break和continue控制
  2.6  運算符
    2.6.1  算術運算符
    2.6.2  賦值運算符
    2.6.3  比較運算符
    2.6.4  邏輯運算符
    2.6.5  成員運算符
    2.6.6  身份運算符
    2.6.7  運算符優先順序
  2.7  字元串處理和正則表達式
    2.7.1  字元串格式化的3種方法
    2.7.2  字元串的編譯執行
    2.7.3  內置字元串處理方法
    2.7.4  正則表達式應用
  2.8  功能模塊的封裝
    2.8.1  函數
    2.8.2  匿名函數
    2.8.3  類
  2.9  高階計算函數的應用
    2.9.1  map
    2.9.2  reduce
    2.9.3  filter
  2.10  導入Python庫
    2.10.1  導入標準庫和第三方庫
    2.10.2  導入自定義庫
    2.10.3  使用庫的別名
    2.10.4  不同庫的導入順序
  2.11  Pandas庫基礎
    2.11.1  創建數據對象
    2.11.2  查看數據信息
    2.11.3  數據切片和切塊
    2.11.4  數據篩選和過濾
    2.11.5  數據預處理操作
    2.11.6  數據合併和匹配
    2.11.7  數據分類匯總
    2.11.8  高級函數使用
  2.12  新手常見誤區
    2.12.1  錯誤的縮進導致功能範圍混亂
    2.12.2  混淆賦值和條件判斷符號
    2.12.3  列表長度與初始索引、終止索引誤用
    2.12.4  表達式或功能缺少冒號
    2.12.5  變數名的衝突問題
    2.12.6  混淆int和round對浮點數的取整

  實訓:對列表中的元素按不同邏輯處理
  思考與練習
第3章  數據對象的讀寫
  3.1  目錄與文件操作
    3.1.1  獲取目錄信息
    3.1.2  目錄的基本操作
    3.1.3  路徑與目錄的組合與拆分
    3.1.4  目錄的判斷
    3.1.5  遍歷目錄
    3.1.6  文件的基本操作
  3.2  數據文件的讀取與寫入
    3.2.1  讀寫普通文件
    3.2.2  讀寫csv、txt、tsv等數據文件
    3.2.3  讀寫Excel文件
    3.2.4  讀寫JSON文件
    3.2.5  讀寫XML文件
    3.2.6  讀寫SPSSStatistics/SAS/Stata數據文件
    3.2.7  讀寫R數據文件
  3.3  資料庫的讀取與寫入
    3.3.1  讀寫結構化資料庫MySQL
    3.3.2  讀寫非結構化資料庫MongoDB
  3.4  數據對象持久化
    3.4.1  使用pickle讀寫持久化對象
    3.4.2  使用sklearn讀寫持久化對象
  3.5  新手常見誤區
    3.5.1  不注意工作路徑導致無法找到文件
    3.5.2  忽視不同操作系統下路徑的表示方法問題
    3.5.3  文件對象未正常關閉導致數據或程序異常
    3.5.4  pickle讀寫對象無法執行read和write方法
    3.5.5  默認讀取的多段落數據末尾有\n而不處理
    3.5.6  文件write寫入的對象不是字元串
  實訓:多條件資料庫讀寫操作
  思考與練習
第4章  數據清洗和預處理
  4.1  數據審核
    4.1.1  查看數據狀態
    4.1.2  審核數據類型
    4.1.3  分析數據分佈趨勢
  4.2  缺失值處理
    4.2.1  查看缺失值記錄
    4.2.2  查看缺失值列
    4.2.3  NA值處理
  4.3  異常值處理
    4.3.1  基於經驗值的判斷和選擇
    4.3.2  基於均值標準差的判斷和選擇
    4.3.3  基於分位數的判斷和選擇
  4.4  重複值處理
    4.4.1  判斷缺失值
    4.4.2  去除重複值
  4.5  數據抽樣

    4.5.1  隨機抽樣
    4.5.2  分層抽樣
  4.6  數據格式與值變換
    4.6.1  字元串轉日期
    4.6.2  提取日期和時間
    4.6.3  提取時間元素
  4.7  數據標準化和歸一化
    4.7.1  Z-SCORE數據標準化
    4.7.2  MaxMin數據歸一化
  4.8  數據離散化和二元化
    4.8.1  基於自定義區間的離散化
    4.8.2  基於分位數法離散化
    4.8.3  基於指定條件的二元化
  4.9  分類特徵處理
    4.9.1  分類特徵轉數值索引
    4.9.2  OneHotencode轉換
  4.10  特徵選擇
  4.11  分詞
  4.12  文本轉向量
  4.13  新手常見誤區
    4.13.1  沒有先做NA值處理導致後續清洗工作頻繁報錯
    4.13.2  直接拋棄異常值
    4.13.3  用數值索引代替分類字元串參與模型計算
    4.13.4  使用分位數法離散化並做不同周期的數據對比
    4.13.5  把抽樣當作一個必備工作環節
  實訓:綜合性數據預處理
  思考與練習
第5章  數據可視化
  5.1  可視化應用概述
    5.1.1  常用數據可視化庫
    5.1.2  如何選擇恰當的可視化方式
  5.2  簡單數據信息的可視化
    5.2.1  使用條形圖和柱形圖表達數據差異
    5.2.2  使用折線圖和柱形圖展示趨勢
    5.2.3  使用餅圖和面積圖展示成分或結構信息
    5.2.4  使用散點圖或蜂窩圖展示數據間關係
  5.3  複雜數據信息的可視化
    5.3.1  使用成對關係圖對多組數據同時做關係可視化
    5.3.2  使用帶回歸擬合線的散點圖做回歸擬合的可視化
    5.3.3  使用熱力圖做相關關係可視化
    5.3.4  使用日曆圖展示不同時間下的銷售分佈
    5.3.5  使用箱型圖和散點圖查看數據分佈規律
    5.3.6  使用分類柱形圖展示多個維度細分值分佈
    5.3.7  使用等高線繪製核密度分佈
    5.3.8  使用坡度圖繪製數據變化差異
    5.3.9  使用漏斗圖展示不同轉化環節的完成情況
    5.3.10  使用關係圖展示不同元素見的關聯關係
    5.3.11  使用雷達圖展示多個元素在不同屬性上的差異
    5.3.12  用詞雲展示關鍵字分佈
  5.4  新手常見誤區

    5.4.1  沒有明確的可視化目標
    5.4.2  通過特殊圖形設置誤導受眾
    5.4.3  選擇過於「花哨」的圖形卻忽略了可視化的本質
    5.4.4  缺乏根據信息表達目標選擇「最佳」圖形的意識
    5.4.5  信息過載
  實訓:綜合性數據可視化
  思考與練習
第6章  基本數據統計分析
  6.1  描述性統計分析
    6.1.1  通用描述信息
    6.1.2  集中性趨勢
    6.1.3  離散性趨勢
  6.2  交叉對比和趨勢分析
    6.2.1  交叉對比分析
    6.2.2  交叉趨勢分析
  6.3  結構與貢獻分析
    6.3.1  占比分析
    6.3.2  二八法則分析
    6.3.3  ABC分析法
    6.3.4  長尾分析
  6.4  分組與聚合分析
    6.4.1  使用分位數聚合分析
    6.4.2  基於均值和標準差的聚合分析
  6.5  相關性分析
    6.5.1  Pearson相關性分析
    6.5.2  Spearman相關性分析
    6.5.3  Kendall相關性分析
  6.6  主成分分析與因子分析
    6.6.1  主成分分析
    6.6.2  因子分析
  6.7  漏斗、路徑與歸因分析
    6.7.1  漏斗分析
    6.7.2  路徑分析
    6.7.3  歸因分析
  6.8  新手常見誤區
    6.8.1  把數據陳述當作數據結論
    6.8.2  通過單一指標得出數據結論
    6.8.3  注重分析過程但沒有分析結論
    6.8.4  忽視數據分析的落地性
  實訓:基本數據統計分析思維訓練
  思考與練習
第7章  高級數據建模分析
  7.1  使用KMeans聚類演算法挖掘用戶潛在特徵
    7.1.1  演算法引言
    7.1.2  案例背景
    7.1.3  數據源概述
    7.1.4  案例過程
    7.1.5  用戶特徵分析
  7.2  使用CART預測用戶是否會產生轉化
    7.2.1  演算法引言

    7.2.2  案例背景
    7.2.3  數據源概述
    7.2.4  案例過程
    7.2.5  分析用戶的轉化可能性
  7.3  使用主成分分析+嶺回歸預測廣告UV量
    7.3.1  演算法引言
    7.3.2  案例背景
    7.3.3  數據源概述
    7.3.4  案例過程
    7.3.5  獲得廣告UV量
    7.3.6  拓展思考
  7.4  使用Apriori關聯分析提高商品銷量
    7.4.1  演算法引言
    7.4.2  案例背景
    7.4.3  數據源概述
    7.4.4  案例過程
    7.4.5  通過關聯分析結果提高銷量
  7.5  使用Prefixspan序列關聯找到用戶下一個訪問頁面
    7.5.1  演算法引言
    7.5.2  案例背景
    7.5.3  數據源概述
    7.5.4  案例過程
    7.5.5  通過序列模式引導用戶頁面訪問行為
    7.5.6  拓展思考
  7.6  使用autoARIMA時間序列預測線下門店銷量
    7.6.1  演算法引言
    7.6.2  案例背景
    7.6.3  數據源概述
    7.6.4  案例過程
    7.6.5  得到未來7天的銷售量
  7.7  使用IsolationForest異常檢測找到異常廣告流量
    7.7.1  演算法引言
    7.7.2  案例背景
    7.7.3  數據源概述
    7.7.4  案例過程
    7.7.5  分析異常檢測結果
  7.8  新手常見誤區
    7.8.1  認為某種演算法適用於所有應用場景
    7.8.2  並不是模型擬合程度越高效果越好
    7.8.3  應用回歸模型時忽略自變數是否產生變化
    7.8.4  關聯分析可以跨維度做分析
    7.8.5  很多時候模型得到的異常未必是真的異常
  實訓
    實訓1  預測用戶是否流失
    實訓2  預測目標用戶的總訂單金額
    實訓3  找到整體用戶頻繁購買的商品
  思考與練習
第8章  自然語言理解和文本挖掘
  8.1  使用結巴分詞提取用戶評論關鍵字
    8.1.1  演算法引言

    8.1.2  案例背景
    8.1.3  數據源概述
    8.1.4  案例過程
    8.1.5  分析用戶評論關鍵字
  8.2  使用LDA主題模型做新聞主題分析
    8.2.1  演算法引言
    8.2.2  案例背景
    8.2.3  數據源概述
    8.2.4  案例過程
    8.2.5  分析主題結果
  8.3  使用隨機森林預測用戶評分傾向
    8.3.1  演算法引言
    8.3.2  案例背景
    8.3.3  數據源概述
    8.3.4  案例過程
    8.3.5  預測新用戶的評分
  8.4  使用TextRank自動生成文章摘要和關鍵短語
    8.4.1  演算法引言
    8.4.2  案例背景
    8.4.3  數據源概述
    8.4.4  案例過程
  8.5  新手常見誤區
    8.5.1  混淆中文分詞與英文分詞引擎
    8.5.2  只用詞頻計算詞的重要性
    8.5.3  忽略文本預處理環節
  實訓:提取關鍵字、關鍵短語和摘要信息
  思考與練習
第9章  數據分析部署和應用
  9.1  批量合併數據文件
    9.1.1  應用背景
    9.1.2  工作需求
    9.1.3  實現過程
  9.2  從資料庫中抽取數據並生成結果文件
    9.2.1  應用背景
    9.2.2  工作需求
    9.2.3  實現過程
  9.3  發送普通Email並附帶數據文件
    9.3.1  應用背景
    9.3.2  工作需求
    9.3.3  實現過程
  9.4  發送HTML富媒體樣式的郵件
    9.4.1  應用背景
    9.4.2  工作需求
    9.4.3  實現過程
  9.5  系統自動執行Python腳本和數據任務
    9.5.1  應用背景
    9.5.2  工作需求
    9.5.3  實現過程
  9.6  新手常見誤區
    9.6.1  不注重自動化的工作方式

    9.6.2  數據輸出物的美觀度也是一種數據價值
    9.6.3  缺乏對自動化作業任務的監控
  實訓:將日常發送郵件工作自動化
  思考與練習
第10章  數據分析與數據化運營
  10.1  數據報告矩陣
    10.1.1  臨時分析
    10.1.2  實時分析
    10.1.3  日常報告
    10.1.4  專題分析
    10.1.5  項目分析
  10.2  分析指標矩陣
    10.2.1  會員運營
    10.2.2  商品運營
    10.2.3  廣告運營
    10.2.4  網站運營
  10.3  探索維度矩陣
    10.3.1  目標端
    10.3.2  媒體端
    10.3.3  用戶端
    10.3.4  網站端
    10.3.5  競爭端
  10.4  應用場景矩陣
    10.4.1  效果預測
    10.4.2  結論定義
    10.4.3  數據探究
    10.4.4  業務執行
  10.5  新手常見誤區
    10.5.1  把數據陳列當作數據結論
    10.5.2  數據結論產生於單一指標
    10.5.3  由數據立場扭曲的數據結論
    10.5.4  忽視多種數據落地方式
  實訓:搭建針對企業的數據化運營應用體系
  思考與練習

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032