幫助中心 | 我的帳號 | 關於我們

數據挖掘導論(原書第2版)/電腦科學叢書

  • 作者:(美)陳封能//邁克爾·斯坦巴赫//阿努吉·卡帕坦//維平·庫瑪爾|譯者:段磊//張天慶
  • 出版社:機械工業
  • ISBN:9787111631620
  • 出版日期:2019/08/01
  • 裝幀:平裝
  • 頁數:480
人民幣:RMB 139 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書所涵蓋的主題包括:數據、分類、關聯分析、聚類分析、異常檢測和避免錯誤發現。通過介紹每個主題的基本概念和演算法,為讀者提供將數據挖掘應用於實際問題所需的必要背景。其中,分類、關聯分析和聚類分析各自組織成兩章的內容,一章講述基本概念、代表性演算法和評估技術,另一章深入討論高級概念和演算法。
    本書適用於數據挖掘專業高年級本科生和研究生教學,也可供相關技術人員參考。

作者介紹
(美)陳封能//邁克爾·斯坦巴赫//阿努吉·卡帕坦//維平·庫瑪爾|譯者:段磊//張天慶
    陳封能(Pang-Ning Tan)密歇根州立大學電腦科學與工程系教授,主要研究方向是數據挖掘、資料庫系統、網路空間安全、網路分析等。

目錄
出版者的話
譯者序
前言
第1章  緒論
  1.1  什麼是數據挖掘
  1.2  數據挖掘要解決的問題
  1.3  數據挖掘的起源
  1.4  數據挖掘任務
  1.5  本書組織結構
  文獻註釋
  參考文獻
  習題
第2章  數據
  2.1  數據類型
    2.1.1  屬性與度量
    2.1.2  數據集的類型
  2.2  數據質量
    2.2.1  測量和數據收集問題
    2.2.2  關於應用的問題
  2.3  數據預處理
    2.3.1  聚集
    2.3.2  抽樣
    2.3.3  維歸約
    2.3.4  特徵子集選擇
    2.3.5  特徵創建
    2.3.6  離散化和二元化
    2.3.7  變數變換
  2.4  相似性和相異性的度量
    2.4.1  基礎
    2.4.2  簡單屬性之間的相似度和相異度
    2.4.3  數據對象之間的相異度
    2.4.4  數據對象之間的相似度
    2.4.5  鄰近度度量的例子
    2.4.6  互信息
    *2.4.7  核函數
    *2.4.8  Bregman散度
    2.4.9  鄰近度計算問題
    2.4.10  選擇正確的鄰近度度量
  文獻註釋
  參考文獻
  習題
第3章  分類:基本概念和技術
  3.1  基本概念
  3.2  一般的分類框架
  3.3  決策樹分類器
    3.3.1  構建決策樹的基本演算法
    3.3.2  表示屬性測試條件的方法
    3.3.3  選擇屬性測試條件的方法
    3.3.4  決策樹歸納演算法
    3.3.5  示例:Web機器人檢測

    3.3.6  決策樹分類器的特徵
  3.4  模型的過擬合
  3.5  模型選擇
    3.5.1  驗證集應用
    3.5.2  模型複雜度合併
    3.5.3  統計範圍估計
    3.5.4  決策樹的模型選擇
  3.6  模型評估
    3.6.1  保持方法
    3.6.2  交叉驗證
  3.7  超參數的使用
    3.7.1  超參數選擇
    3.7.2  嵌套交叉驗證
  3.8  模型選擇和評估中的陷阱
    3.8.1  訓練集和測試集之間的重疊
    3.8.2  使用驗證錯誤率作為泛化錯誤率
  *3.9  模型比較
    3.9.1  估計準確率的置信區間
    3.9.2  比較兩個模型的性能
  文獻註釋
  參考文獻
  習題
第4章  分類:其他技術
第5章  關聯分析:基本概念和演算法
第6章  關聯分析:高級概念
第7章  聚類分析:基本概念和演算法
第8章  聚類分析:其他問題與演算法
第9章  異常檢測
第10章  避免錯誤發現
索引

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032