幫助中心 | 我的帳號 | 關於我們

DeepSeek高效數據分析(從數據清洗到行業案例)

  • 作者:王國平|責編:王金柱
  • 出版社:清華大學
  • ISBN:9787302703785
  • 出版日期:2025/11/01
  • 裝幀:平裝
  • 頁數:310
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以DeepSeek大模型為核心工具,系統講解其在數據分析與可視化中的創新應用。本書共12章。第1章簡要介紹DeepSeek的技術架構、本地部署與在線開發環境,為後續分析奠定技術基礎。第2-4章聚焦多源數據獲取、數據清洗及預處理,提供標準化操作流程與代碼實例。第5-8章介紹描述性統計、頻數分析、相關性分析、線性/曲線/邏輯回歸、K-Means聚類、時間序列分析等核心演算法,結合GDP分析、商品評論挖掘等案例解析其應用邏輯。第9、10章通過混淆矩陣、ROC曲線、交叉驗證等工具評估模型效果,剖析欠擬合/過擬合現象,並講述如何生成結構化分析報告。第11、12章以金融量化和電商平台為場景,串聯Jieba分詞、詞雲生成、雷達圖等工具,還原真實業務問題的解決路徑。
    本書內容新穎,案例豐富,每章配備可復用的實戰代碼,適合數據分析師及相關從業者,以及對AI數據分析感興趣的人員閱讀,也可作為各類學校相關專業的教學用書或參考書。

作者介紹
王國平|責編:王金柱
    王國平,畢業於上海海洋大學,資深數據分析專家,從業10余年,主要從事數據可視化、數據挖掘和大數據分析與研究工作。已出版《動手學PyTorch建模與應用:從深度到大模型》《動手學Excel數據分析與可視化》等圖書。

目錄
第1章  DeepSeek概述
  1.1  DeepSeek大模型:重塑數據分析範式
  1.2  核心技術體系:構建智能分析閉環
  1.3  本地部署DeepSeek
    1.3.1  安裝Ollama
    1.3.2  安裝DeepSeek
    1.3.3  安裝Chatbox
    1.3.4  API調用實戰
  1.4  使用DeepSeek在線開發環境進行工作
    1.4.1  AI代碼編輯器——Cursor
    1.4.2  如何用DeepSeek開始數據分析
  1.5  本章小結
第2章  利用DeepSeek進行數據載入
  2.1  讀取本地離線數據
    2.1.1  讀取CSV文本數據
    2.1.2  讀取Excel文件數據
    2.1.3  讀取本地圖片數據
    2.1.4  讀取PDF文件數據
    2.1.5  讀取XML格式數據
  2.2  讀取資料庫數據
    2.2.1  讀取Oracle資料庫數據
    2.2.2  讀取MySQL資料庫數據
    2.2.3  讀取SQL Server資料庫數據
    2.2.4  讀取Kingbase資料庫數據
    2.2.5  讀取OceanBase資料庫數據
  2.3  讀取Web在線數據
    2.3.1  如何獲取並解析Web數據
    2.3.2  讀取UCI紅酒在線數據
  2.4  本章小結
第3章  利用DeepSeek進行數據清洗
  3.1  重複值的檢測與處理
    3.1.1  重複值的檢測方法
    3.1.2  重複值的處理
  3.2  缺失值的檢測與處理
    3.2.1  缺失值的檢測
    3.2.2  缺失值的處理
  3.3  異常值的檢測與處理
    3.3.1  異常值的檢測
    3.3.2  異常值的處理
  3.4  本章小結
第4章  利用DeepSeek進行數據預處理
  4.1  數據集成
    4.1.1  數據集成概述
    4.1.2  數據橫向合併
    4.1.3  數據縱向合併
  4.2  數據轉換
    4.2.1  數據轉換概述
    4.2.2  數據標準化處理方法
    4.2.3  數據二值化處理方法
    4.2.4  數據離散化處理方法

  4.3  數據集劃分
    4.3.1  數據集劃分概述
    4.3.2  訓練集和測試集法
    4.3.3  訓練集/驗證集/測試集法
    4.3.4  分層抽樣法
  4.4  本章小結
第5章  利用DeepSeek進行數據探索
  5.1  描述性分析
    5.1.1  描述性分析概述
    5.1.2  案例:國內生產總值描述性分析
  5.2  頻數分析
    5.2.1  頻數分析概述
    5.2.2  案例:居民消費水平頻數分析
  5.3  探索分析
    5.3.1  探索分析概述
    5.3.2  案例:商品評論得分探索分析
  5.4  交叉表分析
    5.4.1  交叉表分析概述
    5.4.2  案例:商品顏色交叉表分析
  5.5  相關分析
    5.5.1  相關關係概述
    5.5.2  案例:鐵路和公路貨運量分析
  5.6  偏相關分析
    5.6.1  偏相關分析概述
    5.6.2  案例:鐵路和公路貨運量分析
  5.7  本章小結
第6章  利用DeepSeek進行回歸分析
  6.1  線性回歸
    6.1.1  線性回歸概述
    6.1.2  案例:貸款申請人負債率分析
  6.2  曲線回歸
    6.2.1  曲線回歸概述
    6.2.2  案例:信用額度使用率分析
  6.3  邏輯回歸
    6.3.1  邏輯回歸概述
    6.3.2  案例:貸款客戶是否違約分析
  6.4  本章小結
第7章  利用DeepSeek進行聚類分析
  7.1  聚類分析簡介
  7.2  K-Means聚類
    7.2.1  K-Means演算法
    7.2.2  案例:水質監測聚類分析
  7.3  手肘法判斷聚類數
    7.3.1  手肘法概述
    7.3.2  案例:手肘法判斷聚類數
  7.4  輪廓係數法判斷聚類數
    7.4.1  輪廓係數法
    7.4.2  案例:輪廓係數法判斷聚類數
  7.5  本章小結
第8章  利用DeepSeek進行時間序列分析

  8.1  時間序列分析概述
    8.1.1  時序數據簡介
    8.1.2  時間序列演算法
  8.2  指數平滑法及其案例
    8.2.1  指數平滑法
    8.2.2  案例:製造業採購經理指數預測
  8.3  ARIMA模型及其案例
    8.3.1  ARIMA模型
    8.3.2  案例:居民消費價格指數預測
  8.4  本章小結
第9章  利用DeepSeek進行模型評估
  9.1  模型評估方法
    9.1.1  混淆矩陣及案例
    9.1.2  ROC曲線及案例
    9.1.3  R平方及案例
    9.1.4  殘差及案例
    9.1.5  交叉驗證及案例
    9.1.6  學習曲線及案例
  9.2  欠擬合及其案例
    9.2.1  欠擬合及其影響
    9.2.2  案例:波士頓房價回歸分析
  9.3  過擬合及其案例
    9.3.1  過擬合及其影響
    9.3.2  案例:基於隨機森林的鳶尾花分類
  9.4  本章小結
第10章  利用DeepSeek撰寫分析報告
  10.1  數據分析報告的作用
  10.2  DeepSeek撰寫數據分析報告的注意事項
  10.3  案例:電商數據分析報告
    10.3.1  分析背景
    10.3.2  理解數據
    10.3.3  數據清洗
    10.3.4  數據分析
    10.3.5  案例總結
  10.4  本章小結
第11章  案例:DeepSeek金融量化數據分析
  11.1  案例概述
    11.1.1  K線圖技術理論
    11.1.2  案例數據採集
  11.2  數據基礎分析
    11.2.1  查看數據集信息
    11.2.2  數據描述性分析
    11.2.3  數據可視化分析
  11.3  股票數據分析
    11.3.1  指標相關性分析
    11.3.2  指標趨勢性分析
    11.3.3  股票交易時機分析
  11.4  本章小結
第12章  案例:DeepSeek電商平台數據分析
  12.1  案例背景

  12.2  商品銷售數據分析
    12.2.1  每日商品訂單量日曆圖
    12.2.2  每月商品銷售額折線圖
    12.2.3  不同區域銷售業績雷達圖
  12.3  商品評論文本分析
    12.3.1  中文Jieba分詞概述
    12.3.2  商品評論關鍵詞分析
    12.3.3  商品評論關鍵詞詞雲
  12.4  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032