幫助中心 | 我的帳號 | 關於我們

SPSS Modeler數據挖掘方法及應用(第4版)/數據科學與大數據技術系列

  • 作者:編者:薛薇|責編:秦淑靈
  • 出版社:電子工業
  • ISBN:9787121500923
  • 出版日期:2025/04/01
  • 裝幀:平裝
  • 頁數:348
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    數據挖掘是人工智慧和機器學習中最活躍的地帶。SPSS Modeler充分利用電腦系統的運算處理能力和圖形展現能力,將數據挖掘方法、應用與工具有機地融為一體,成為內容全面、功能強大、操作友好的數據挖掘軟體產品,是大數據分析的理想工具。
    本書以數據挖掘的實踐過程為主線,系統介紹了決策樹、人工神經網路、支持向量機、Logistic回歸、判別分析、貝葉斯網路、聚類分析等一系列經典數據挖掘方法,以及數據整理和降維處理等必備知識。同時基於案例給出了SPSS Modeler實現的全過程。講解方法從易到難,說明問題從淺至深,軟體操作詳細全面。
    本書力求以通俗的方式闡述數據挖掘方法的核心思想與基本原理,同時配合SPSS Modeler軟體操作說明。希望讀者能夠直觀理解方法本質,快速掌握軟體使用,並應用到數據挖掘實踐中。

作者介紹
編者:薛薇|責編:秦淑靈
    薛薇,博士,中國人民大學應用統計研究中心專職研究員,中國人民大學統計學院副教授。主要開設課程:機器學習,計量經濟學,統計軟體,統計學。研究方向:機器學習與深度學習演算法研究。基於顧客消費行為大數據的客戶終身價值統計建模,以及營銷與品牌大數據的機器學習演算法應用。

目錄
第1章  數據挖掘和SPSS Modeler使用概述
  1.1  數據挖掘的產生背景
    1.1.1  海量大數據的分析需求催生數據挖掘
    1.1.2  應用對理論的挑戰催生數據挖掘
  1.2  什麼是數據挖掘
    1.2.1  數據挖掘和資料庫中的知識發現
    1.2.2  數據挖掘方法論
    1.2.3  數據挖掘的任務和應用
    1.2.4  數據挖掘得到的知識形式
    1.2.5  數據挖掘演算法的分類
  1.3  SPSS Modeler軟體概述
    1.3.1  SPSS Modeler的數據流
    1.3.2  SPSS Modeler的窗口
    1.3.3  數據流的基本管理
    1.3.4  緩存節點和超節點
    1.3.5  從一個示例看SPSS Modeler的使用
第2章  SPSS Modeler的數據讀入和數據集成
  2.1  變數類型
    2.1.1  從數據挖掘角度看變數類型
    2.1.2  從電腦存儲角度看變數類型
  2.2  讀入數據
    2.2.1  讀自由格式的文本文件
    2.2.2  讀Excel電子錶格數據
    2.2.3  讀SPSS格式文件
  2.3  數據集成
    2.3.1  數據的縱向合併
    2.3.2  數據的橫向合併
    2.3.3  數據源替換
第3章  SPSS Modeler的數據理解
  3.1  變數說明
    3.1.1  變數的重新實例化
    3.1.2  有效變數值和無效值調整
    3.1.3  變數角色的說明
  3.2  數據質量的評估和調整
    3.2.1  數據的基本特徵與質量評價報告
    3.2.2  變數值的調整
    3.2.3  數據質量管理
  3.3  數據的排序
    3.3.1  單變數排序
    3.3.2  多重排序
  3.4  數據的分類匯總
    3.4.1  單變數分類匯總
    3.4.2  多重分類匯總
第4章  SPSS Modeler的數據準備
  4.1  變數變換
    4.1.1  CLEM表達式
    4.1.2  變數值的重新計算
    4.1.3  變數類別值的調整
  4.2  變數派生
    4.2.1  生成新變數

    4.2.2  生成服從正態分佈的新變數
    4.2.3  派生啞變數
  4.3  數據精簡
    4.3.1  隨機抽樣
    4.3.2  根據條件選取樣本
  4.4  建模中的數據集處理策略
    4.4.1  樣本的平衡處理
    4.4.2  樣本子集的劃分
第5章  SPSS Modeler的基本分析
  5.1  數值型變數的基本分析
    5.1.1  計算基本描述統計量
    5.1.2  繪製散點圖
    5.1.3  繪製線圖
  5.2  兩分類型變數相關性的研究
    5.2.1  兩分類型變數相關性的圖形分析
    5.2.2  兩分類型變數相關性的數值分析
  5.3  兩總體的均值比較
    5.3.1  兩總體均值比較的圖形分析
    5.3.2  獨立樣本的均值檢驗
    5.3.3  配對樣本的均值檢驗
  5.4  RFM分析
    5.4.1  什麼是RFM分析
    5.4.2  RFM匯總
    5.4.3  計算RFM得分
第6章  SPSS Modeler的數據精簡
  6.1  變數值的離散化處理
    6.1.1  無監督的數據分組
    6.1.2  有監督的數據分組
    6.1.3  變數值離散化處理的應用示例
  6.2  特徵選擇
    6.2.1  特徵選擇的一般方法
    6.2.2  特徵選擇的應用示例
  6.3  因子分析
    6.3.1  什麼是因子分析
    6.3.2  因子提取和因子載荷矩陣的求解
    6.3.3  因子的命名解釋
    6.3.4  計算因子得分
    6.3.5  因子分析的應用示例
第7章  分類預測:SPSS Modeler的決策樹
  7.1  決策樹演算法概述
    7.1.1  什麼是決策樹
    7.1.2  決策樹的幾何理解
    7.1.3  決策樹的核心問題
  7.2  SPSS Modeler的C5.0演算法及其應用
    7.2.1  信息熵和信息增益
    7.2.2  C5.0決策樹的生長演算法
    7.2.3  C5.0決策樹的剪枝演算法
    7.2.4  C5.0決策樹的基本應用示例
    7.2.5  C5.0的推理規則集
    7.2.6  損失矩陣

    7.2.7  N折交叉驗證和Boosting技術
  7.3  SPSS Modeler的分類回歸樹及其應用
    7.3.1  分類回歸樹的生長過程
    7.3.2  分類回歸樹的剪枝過程
    7.3.3  損失矩陣對分類回歸樹的影響
    7.3.4  分類回歸樹的基本應用示例
    7.3.5  分類回歸樹的交互建模
    7.3.6  交互建模中分類回歸樹的評價
  7.4  SPSS Modeler的CHAID演算法及其應用
    7.4.1  CHAID演算法
    7.4.2  窮舉CHAID演算法
    7.4.3  CHAID演算法的剪枝
    7.4.4  CHAID演算法的應用示例
  7.5  SPSS Modeler的QUEST演算法及其應用
    7.5.1  QUEST演算法
    7.5.2  QUEST演算法的應用示例
  7.6  模型的對比分析
    7.6.1  不同模型的誤差對比
    7.6.2  不同模型的收益對比
第8章  分類預測:SPSS Modeler的人工神經網路
  8.1  人工神經網路演算法概述
    8.1.1  人工神經網路的概念和種類
    8.1.2  人工神經網路中的節點和意義
    8.1.3  人工神經網路建立的一般步驟
  8.2  SPSS Modeler的B-P反向傳播網路
    8.2.1  感知機模型
    8.2.2  B-P反向傳播網路的特點
    8.2.3  B-P反向傳播演算法
    8.2.4  B-P反向傳播網路的其他問題
  8.3  SPSS Modeler的B-P反向傳播網路的應用
    8.3.1  基本操作
    8.3.2  結果說明
  8.4  SPSS Modeler的徑向基函數網路及其應用
    8.4.1  徑向基函數網路中的隱節點和輸出節點
    8.4.2  徑向基函數網路的學習過程
    8.4.3  徑向基函數網路的應用示例
第9章  分類預測:SPSS Modeler的支持向量機
  9.1  支持向量分類的基本思路
    9.1.1  支持向量分類的數據和目標
    9.1.2  支持向量分類的三種情況
  9.2  線性可分問題下的支持向量分類
    9.2.1  如何求解超平面
    9.2.2  如何利用超平面進行分類預測
  9.3  廣義線性可分下的支持向量分類
    9.3.1  如何求解超平面
    9.3.2  可調參數的意義:把握程度和精度的權衡
  9.4  線性不可分下的支持向量分類
    9.4.1  線性不可分的一般解決途徑和維災難問題
    9.4.2  支持向量分類克服維災難的途徑
  9.5  支持向量回歸

    9.5.1  支持向量回歸與一般線性回歸:目標和策略
    9.5.2  支持向量回歸的基本思路
  9.6  支持向量機的應用
    9.6.1  基本操作
    9.6.2  結果解讀
第10章  分類預測:SPSS Modeler的Logistic回歸分析
  10.1  Logistic回歸分析概述
  10.2  二項Logistic回歸分析
    10.2.1  二項Logistic回歸方程
    10.2.2  二項Logistic回歸方程係數的含義
    10.2.3  二項Logistic回歸方程的檢驗
    10.2.4  二項Logistic回歸分析中的虛擬自變數
  10.3  二項Logistic回歸分析的應用
    10.3.1  基本操作
    10.3.2  結果解讀
  10.4  多項Logistic回歸分析及其應用
    10.4.1  多項Logistic回歸分析概述
    10.4.2  多項Logistic回歸分析的應用示例
第11章  分類預測:SPSS Modeler的判別分析
  11.1  距離判別
    11.1.1  距離判別的基本思路
    11.1.2  判別函數的計算
  11.2  Fisher判別
    11.2.1  Fisher判別的基本思路
    11.2.2  Fisher判別的計算
  11.3  貝葉斯判別
    11.3.1  貝葉斯判別的基本思路
    11.3.2  貝葉斯判別的計算
  11.4  判別分析的應用
    11.4.1  基本操作
    11.4.2  判別分析的準備工作
    11.4.3  結果解讀
第12章  分類預測:SPSS Modeler的貝葉斯網路
  12.1  貝葉斯方法基礎
    12.1.1  貝葉斯概率和貝葉斯公式
    12.1.2  樸素貝葉斯分類法
  12.2  貝葉斯網路概述
    12.2.1  什麼是貝葉斯網路
    12.2.2  貝葉斯網路的組成及構建
    12.2.3  樸素貝葉斯網路及分類預測
  12.3  TAN貝葉斯網路
    12.3.1  TAN貝葉斯網路的結構
    12.3.2  TAN貝葉斯網路結構的學習
    12.3.3  TAN貝葉斯網路的參數估計
  12.4  馬爾可夫毯網路
    12.4.1  馬爾可夫毯網路的基本概念
    12.4.2  條件獨立檢驗
    12.4.3  馬爾可夫毯網路結構的學習
    12.4.4  馬爾可夫毯網路的分類預測
  12.5  貝葉斯網路的應用

    12.5.1  基本操作
    12.5.2  結果解讀
第13章  探索內部結構:SPSS Modeler的關聯分析
  13.1  簡單關聯規則及其有效性
    13.1.1  簡單關聯規則的基本概念
    13.1.2  簡單關聯規則的有效性和實用性
  13.2  SPSS Modeler的Apriori演算法及其應用
    13.2.1  產生頻繁項集
    13.2.2  依據頻繁項集產生簡單關聯規則
    13.2.3  Apriori演算法的應用示例
  13.3  SPSS Modeler的序列關聯及其應用
    13.3.1  序列關聯中的基本概念
    13.3.2  Sequence演算法
    13.3.3  序列關聯的時間約束
    13.3.4  Sequence演算法的應用示例
第14章  探索內部結構:SPSS Modeler的聚類分析
  14.1  聚類分析的一般問題
    14.1.1  聚類分析的提出
    14.1.2  聚類演算法
  14.2  SPSS Modeler的K-Means聚類及應用
    14.2.1  K-Means聚類對「親疏程度」的測度
    14.2.2  K-Means聚類過程
    14.2.3  K-Means聚類的應用示例
  14.3  SPSS Modeler的兩步聚類及其應用
    14.3.1  兩步聚類對「親疏程度」的測度
    14.3.2  兩步聚類過程
    14.3.3  聚類數目的確定
    14.3.4  兩步聚類的應用示例
  14.4  SPSS Modeler的Kohonen網路聚類及其應用
    14.4.1  Kohonen網路聚類機理
    14.4.2  Kohonen網路聚類過程
    14.4.3  Kohonen網路聚類的應用示例
  14.5  基於聚類分析的離群點探索
    14.5.1  多維空間基於聚類的離群點診斷方法
    14.5.2  多維空間基於聚類的離群點診斷應用示例

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032