幫助中心 | 我的帳號 | 關於我們

探尋數據背後的邏輯(R語言數據挖掘之道)

  • 作者:宋雲生//張堅洪//黎新年
  • 出版社:電子工業
  • ISBN:9787121338618
  • 出版日期:2018/08/01
  • 裝幀:平裝
  • 頁數:416
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    數據分析、數據挖掘的本質是探尋數據背後的邏輯,挖掘人們的慾望、需求、態度等。宋雲生、張堅洪、黎新年著的《探尋數據背後的邏輯(R語言數據挖掘之道)》不僅僅教會讀者如何掌握數據挖掘相關技能,更教會讀者如何從數據挖掘結果中分析出更深層次的邏輯。
    本書主要介紹使用R語言進行數據挖掘的過程。具體內容包括R軟體的安裝及R語言基礎知識、數據探索、數據可視化、回歸預測分析、時間序列分析、演算法選擇流程及十大演算法介紹、數據抓取、社交網路關係分析、情感分析、話題模型、推薦系統,以及數據挖掘在生物信息學中的應用。另外,本書還介紹了R腳本優化相關內容,使讀者的數據挖掘技能更上一層樓。
    本書適合從事數據挖掘、數據分析、市場研究的工作者及學生群體,以及對數據挖掘和數據分析感興趣的初級讀者。

作者介紹
宋雲生//張堅洪//黎新年

目錄
第1章  萬事不只開頭難
  1.1  工欲善其事,必先利其器:安裝
    1.1.1  安裝R和R
    1.1.2  安裝數據包
    1.1.3  數據包載入、卸載、升級,查看幫助文檔
    1.1.4  什麼樣的R包值得相信
  1.2  了解R的對象
    1.2.1  如何進行常見的算術運算
    1.2.2  R語言的三大數據類型
    1.2.3  向量及其運算
    1.2.4  因子變數鮮有人知的秘密
    1.2.5  矩陣相關運算及神奇的特徵值
    1.2.6  數據框及其篩選、替換、添加、排序、去重
    1.2.7  與數組(array)相比,表單(list)的用處更加廣泛
    1.2.8  如何進行數據結構之間的轉化
  1.3  R語言的重器:函數
    1.3.1  自編函數
    1.3.2  有用的R字元串函數
  1.4  控制流在R語言里只是一種輔助工具
    1.4.1  判斷
    1.4.2  循環
  1.5  數據的讀入與輸出
    1.5.1  常見數據格式的輸入/輸出(CSV、TXT、RDATA、XLSX)
    1.5.2  資料庫連接:Oracle、MySQL及Hive
    1.5.3  亂碼就像馬賽克一樣讓人討厭
第2章  數據探索,招招都是利器
  2.1  不要在工作后才認識「臟數據」
    2.1.1  以老闆信服的方式處理缺失數據
    2.1.2  異常值預警
    2.1.3  字元處理正則表達式不再是天書
  2.2  數據透視、數據整形、關聯融合與批量處理
    2.2.1  還忘不掉Excel的數據透視表嗎
    2.2.2  你能給數據做整形手術嗎:long型和wide型
    2.2.3  關聯合併表
    2.2.4  數據批處理:R語言里最重要的一個函數家族:*pply
  2.3  一招完成數據探索報告
  2.4  拯救你的很多時候是基礎理論
    2.4.1  參數檢驗及非參檢驗
    2.4.2  學了很多演算法卻忘了方差分析
    2.4.3  多因素方差分析及協方差作用
    2.4.4  很多熟悉的數據處理方法已經成笑話,工具箱該換了
第3章  從商務氣質的數據可視化說起
  3.1  說說數據可視化的專業素養
    3.1.1  數據可視化歷史上有多少背影等你仰望
    3.1.2  商務圖表應該具有哪些素質
    3.1.3  那些你不知道的圖表誤導性伎倆
    3.1.4  如何快速解構著名雜誌的圖表
  3.2  ggplot2包:一個價值8萬美元的態度
    3.2.1  一張圖學會ggplot2包的繪圖原理
    3.2.2  基礎繪圖科學:ggplot2包的主題函數繼承關係圖(關係網路圖)

    3.2.3  基礎圖表一網打盡
    3.2.4  古老的地圖煥發新顏
  3.3  將靜態圖轉為D3交互圖表:plotly
  3.4  從基礎到進階的變形圖表
    3.4.1  馬賽克圖(分類變數描述性分析)
    3.4.2  Sankey圖和chordDiagram圖
第4章  分位數回歸模擬股票指數風險通道
  4.1  用線性回歸預測醫院的藥品銷售額
  ……
第5章  時間序列分析
第6章  選擇什麼演算法也有一套流程
第7章  深入淺出十大演算法
第8章  數據抓取
第9章  不可不說的社交網路關係
第10章  情感分析:一種準確率高達90%的新方法?
第11章  話題模型:很多牛人過不去的坎兒
第12章  排名就是簡單的推薦系統嗎?
第13章  生物信息學中的數據挖掘案例
第14章  產品化:關於內存、速度和自動化

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032