幫助中心 | 我的帳號 | 關於我們

Python數據挖掘與機器學習實戰

  • 作者:編者:方巍
  • 出版社:機械工業
  • ISBN:9787111626817
  • 出版日期:2019/06/01
  • 裝幀:平裝
  • 頁數:263
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書作為數據挖掘和機器學習的讀物,基於真實數據集進行案例實戰,使用Python數據科學庫,從數據預處理開始一步步介紹數據建模和數據挖掘的過程。書中主要介紹了數據挖掘的基礎知識、基本工具和實踐方法,通過循序漸進地講解演算法,帶領讀者輕鬆踏上數據挖掘之旅。本書採用理論與實踐相結合的方式,呈現了如何使用邏輯回歸進行環境數據檢測,如何使用HMM進行中文分詞,如何利用卷積神經網路識別雷達剖面圖,如何使用循環神經網路構建聊天機器人,如何使用樸素貝葉斯演算法進行破產預測,如何使用DCGAN網路進行人臉生成等。本書也涉及神經網路、在線學習、強化學習、深度學習和大數據處理等內容。
    本書以人工智慧主流編程語言Python 3版作為數據分析與挖掘實戰的應用工具,從Pyhton的基礎語法開始,陸續介紹了NumPy數值計算、Pandas數據處理、Matplotlib數據可視化、爬蟲和skleam數據挖掘等內容。全書共涵蓋16個常用的數據挖掘演算法和機器學習實戰項目。通過學習本書內容。讀者可以掌握數據分析與挖掘的理論知識及實戰技能。
    本書內容豐富,講解由淺入深,特別適合對數據挖掘和機器學習演算法感興趣的讀者閱讀,也適合需要系統掌握深度學習的開發人員閱讀,還適合Python程序員及人工智慧領域的開發人員閱讀。編程愛好者、高校師生及培訓機構的學員也可以將本書作為興趣讀物或教材使用。

作者介紹
編者:方巍
    方巍  博士、博士后、副教授、碩導、高級工程師。美國佛羅里達大學訪問學者、中國電腦學會高級會員、ACM會員、中國系統分析師協會(CSAI)顧問團專業顧問、江蘇省電腦學會會員和江蘇省人工智慧學會委員、江蘇省政府採購招標評審專家。有多年的Java EE和資料庫軟體開發與設計經驗,深入理解資料庫系統的應用與開發過程。目前已主持了2項省部級項目和3項市廳級項目,參與了國家自然科學基金、教育部重點科研項目、江蘇省重大科技支撐計劃等國家級和省部級科研項目共8項。在國際和國內相關學術會議和核心期刊上發表了論文20余篇,其中被SCI和EI檢索15篇。獲得了國家發明專利授權7項和軟體著作權8項。研究興趣包括信息集成、雲計算和大數據挖掘等。

目錄
前言
第1章  機器學習基礎
  1.1  機器學習概述
  1.2  機器學習的發展歷程
  1.3  機器學習分類
    1.3.1  監督學習
    1.3.2  無監督學習
    1.3.3  強化學習
    1.3.4  深度學習
  1.4  機器學習的應用
  1.5  開發機器學習的步驟
  1.6  Python語言的優勢
    1.6.1  可執行偽代碼
    1.6.2  Python語言使用廣泛
    1.6.3  Python語言特色
    1.6.4  Python語言的缺點
  1.7  Python開發工具介紹
    1.7.1  IDLE簡介
    1.7.2  IPython簡介
    1.7.3  PyCharm簡介
    1.7.4  Jupyter Notebook簡介
    1.7.5  Anaconda和Spyder簡介
  1.8  本章小結
第2章  Python語言簡介
  2.1  搭建Python開發環境
    2.1.1  安裝Anaconda
    2.1.2  安裝Spyder
    2.1.3  運行和保存Python程序
  2.2  Python計算與變數
    2.2.1  用Python做簡單的計算
    2.2.2  Python的運算符
    2.2.3  Python的變數
  2.3  Python的字元串
  2.4  Python的列表
  2.5  Python的元組
  2.6  Python的字典
  2.7  網路爬蟲的發展歷史和分類
    2.7.1  網路爬蟲的發展歷史
    2.7.2  網路爬蟲的分類
  2.8  網路爬蟲的原理
    2.8.1  理論概述
    2.8.2  爬蟲的工作流程
  2.9  爬蟲框架介紹
    2.9.1  Scrapy介紹
    2.9.2  XPath介紹
  2.10  網路爬蟲的設計與實現
    2.10.1  網路爬蟲的總體設計
    2.10.2  具體實現過程
    2.10.3  爬蟲結果與分析
  2.11  本章小結

第3章  回歸分析
  3.1  回歸分析概述
    3.1.1  基本概念
    3.1.2  可以解決的問題
    3.1.3  回歸分析的步驟
  3.2  線性回歸
    3.2.1  簡單線性回歸分析
    3.2.2  多元線性回歸分析
    3.2.3  非線性回歸數據分析
  3.3  用Python實現一元線性回歸
  3.4  用Python實現多元線性回歸
    3.4.1  使用pandas讀取數據
    3.4.2  分析數據
    3.4.3  線性回歸模型
  3.5  基於線性回歸的股票預測
    3.5.1  數據獲取
    3.5.2  數據預處理
    3.5.3  編碼實現
    3.5.4  結果分析
  3.6  邏輯回歸
    3.6.1  構造預測函數
    3.6.2  構造損失函數J
    3.6.3  梯度下降法求解最小值
  3.7  基於邏輯回歸的環境數據檢測
    3.7.1  數據來源
    3.7.2  數據處理
    3.7.3  異常數據分析
    3.7.4  數據預測
  3.8  本章小結
第4章  決策樹與隨機森林
  4.1  決策樹
    4.1.1  決策樹的基本原理
    4.1.2  決策樹的分類
    4.1.3  決策樹的優缺點
  4.2  使用決策樹對鳶尾花分類
    4.2.1  Iris數據集簡介
    4.2.2  讀取數據
    4.2.3  鳶尾花類別
    4.2.4  數據可視化
    4.2.5  訓練和分類
    4.2.6  數據集多類分類
    4.2.7  實驗結果
  4.3  隨機森林
    4.3.1  隨機森林的基本原理
    4.3.2  隨機森林的收斂性
    4.3.3  隨機森林的OOB估計
    4.3.4  隨機森林的隨機特徵選取
    4.3.5  隨機森林的優缺點
  4.4  葡萄酒數據集的隨機森林分類
    4.4.1  數據收集

    4.4.2  相關庫函數簡介
    4.4.3  數據基本分析
    4.4.4  使用隨機森林構建模型
    4.4.5  實驗結果
  4.5  本章小結
第5章  支持向量機
  5.1  SVM的工作原理及分類
    5.1.1  支持向量機的原理
    5.1.2  線性可分的支持向量機
    5.1.3  非線性可分的支持向量機
  5.2  核函數
    5.2.1  核函數簡介
    5.2.2  幾種常見的核函數
    5.2.3  核函數如何處理非線性數據
    5.2.4  如何選擇合適的核函數
  5.3  SVR簡介
    5.3.1  SVR原理
    5.3.2  SVR模型
  5.4  時間序列曲線預測
    5.4.1  生成訓練數據集
    5.4.2  運用不同的核函數進行支持向量回歸
    5.4.3  生成測試數據集
    5.4.4  預測並生成圖表
    5.4.5  獲取預測誤差
    5.4.6  創建數據集
    5.4.7  選取最優參數
    5.4.8  預測並生成圖表
    5.4.9  獲取預測誤差
  5.5  本章小結
第6章  隱馬爾可夫模型
  6.1  隱馬爾可夫模型簡介
    6.1.1  隱馬爾可夫模型的概念
    6.1.2  詳例描述
    6.1.3  HMM流程
  6.2  Viterbi演算法
  6.3  HMM模型用於中文分詞
    6.3.1  UI界面
    6.3.2  數據及其編碼
    6.3.3  HMM模型
    6.3.4  實驗結果
  6.4  本章小結
第7章  BP神經網路模型
  7.1  背景介紹
  7.2  結構特點
  7.3  網路模型
  7.4  人工神經網路簡介
    7.4.1  神經元
    7.4.2  單層神經網路
    7.4.3  雙層神經網路
    7.4.4  多層神經網路

  7.5  BP神經網路
  7.6  通過TensorFlow實現BP神經網路
  7.7  本章小結
第8章  卷積神經網路
  8.1  傳統圖像識別技術
    8.1.1  圖像預處理
    8.1.2  圖像特徵提取
    8.1.3  圖像分類方法
  8.2  卷積神經網路結構簡介
    8.2.1  卷積神經網路發展歷程
    8.2.2  卷積神經網路結構簡介
  8.3  卷積神經網路的結構及原理
    8.3.1  卷積層
    8.3.2  池化層
    8.3.3  激活函數
    8.3.4  全連接層
    8.3.5  反饋運算
  8.4  卷積神經網路的優點
  8.5  雷達剖面圖識別模型
    8.5.1  數據準備
    8.5.2  構建模型
  8.6  模型測試分析
    8.6.1  部署基本模塊
    8.6.2  創建項目結構
    8.6.3  訓練網路
    8.6.4  自動化測試
  8.7  本章小結
第9章  循環神經網路
  9.1  自然語言處理
    9.1.1  自然語言處理概述
    9.1.2  自然語言處理應用
  9.2  對話系統
    9.2.1  對話系統分類
    9.2.2  聊天機器人分類
  9.3  基於LSTM結構的循環神經網路
    9.3.1  循環神經網路
    9.3.2  通過時間反向傳播
    9.3.3  長短期記憶網路(LSTM)
  9.4  Seq2Seq模型
    9.4.1  Encoder-Decoder框架
    9.4.2  Attention機制
  9.5  聊天機器人的程序實現
    9.5.1  準備數據
    9.5.2  創建模型
    9.5.3  訓練模型
    9.5.4  測試模型
  9.6  本章小結
第10章  聚類與集成演算法
  10.1  聚類方法簡介
    10.1.1  聚類定義

    10.1.2  聚類要求
  10.2  聚類演算法
    10.2.1  劃分方法
    10.2.2  層次方法
    10.2.3  基於密度的方法
    10.2.4  基於網格的方法
    10.2.5  基於模型的方法
  10.3  K-Means演算法
    10.3.1  K-Means演算法概述
    10.3.2  K-Means演算法流程
    10.3.3  K-Means演算法實現
    10.3.4  實驗結果及分析
    10.3.5  K-Means演算法存在的問題
  10.4  K-Means++演算法
    10.4.1  K-Means++的基本思想
    10.4.2  K-Means++的數學描述
    10.4.3  K-Means++演算法流程
  10.5  K-Means++的實現
    10.5.1  數據集
    10.5.2  代碼實現
    10.5.3  K-Means++實驗結果
  10.6  Adaboost集成演算法的原理
    10.6.1  Boosting演算法的基本原理
    10.6.2  Adaboost演算法介紹
    10.6.3  Adaboost分類問題的損失函數優化
    10.6.4  Adaboost二元分類問題的演算法流程
    10.6.5  Adaboost回歸問題的演算法流程
    10.6.6  Adaboost演算法的正則化
    10.6.7  Adaboost的優缺點
  10.7  Adaboost演算法實現
    10.7.1  數據集處理
    10.7.2  實現過程
    10.7.3  實驗結果分析
  10.8  本章小結
第11章  其他機器學習演算法
  11.1  貝葉斯分類器
    11.1.1  概率基礎知識
    11.1.2  貝葉斯決策準則
    11.1.3  極大似然估計
  11.2  貝葉斯分類模型
    11.2.1  樸素貝葉斯分類模型
    11.2.2  半樸素貝葉斯分類模型
    11.2.3  貝葉斯網路分類模型
  11.3  樸素貝葉斯分類器在破產預測中的應用
    11.3.1  數據集
    11.3.2  訓練多項式樸素貝葉斯模型
  11.4  在線學習
    11.4.1  線性模型的在線學習
    11.4.2  非線性模型的在線學習
  11.5  Bandit在線學習演算法

    11.5.1  Bandit演算法與推薦系統
    11.5.2  常用Bandit演算法
  11.6  Bandit演算法原理及實現
  11.7  GAN網路
    11.7.1  GAN產生的背景
    11.7.2  模型結構
    11.7.3  GAN的實現原理
  11.8  DCGAN網路
    11.8.1  模型結構
    11.8.2  反卷積
  11.9  DCGAN人臉生成
    11.9.1  實驗準備
    11.9.2  關鍵模塊的實現
    11.9.3  實驗結果展示
  11.10  本章小結
附錄A  機器學習常見面試題
附錄B  數學基礎
  B.1  常用符號
  B.2  數學基礎知識
    B.2.1  線性代數
    B.2.2  概率論
    B.2.3  資訊理論
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032