幫助中心 | 我的帳號 | 關於我們

大數據分析(理論方法及應用)/數據科學與工程技術叢書

  • 作者:(德)史蒂文·S.斯基納|責編:王春華|譯者:徐曼
  • 出版社:機械工業
  • ISBN:9787111703471
  • 出版日期:2022/04/01
  • 裝幀:平裝
  • 頁數:321
人民幣:RMB 129 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書對迅速興起的數據科學跨學科領域提供必要的介紹,內容引人入勝,敘述條理清晰,特彆強調分析數據時什麼是真正重要的內容,使讀者直觀地理解如何使用這些核心概念。具體內容主要包括數據科學是什麼、數據整理、得分和排名、統計分析、數據可視化、數學模型、線性代數、線性回歸、logistic回歸、距離和網路方法、機器學習、大數據等。
    本書特別適合作為數據科學和大數據相關專業本科生和低年級研究生的教材,也非常適合作為該領域和相關領域從業者的自學參考書。

作者介紹
(德)史蒂文·S.斯基納|責編:王春華|譯者:徐曼
    史蒂文·S.斯基納(Steven S.Skiena),博士,石溪大學的傑出教授,研究方向是數據科學、自然語言處理和演算法。由於對本科教學工作有傑出貢獻,他曾獲得IEEE電腦科學與工程本科教學獎。他還撰寫了6本書,包括知名的The Algorithm Design Manual、Programming Challenges: The Programming Contest Training Marelal。

目錄
譯者序
前言
第1章  什麼是數據科學
  1.1  電腦科學、數據科學和真正的科學
  1.2  從數據中提出有趣的問題
    1.2.1  棒球百科全書
    1.2.2  互聯網電影資料庫
    1.2.3  Google Ngrams
    1.2.4  紐約計程車記錄
  1.3  數據的屬性
    1.3.1  結構化與非結構化數據
    1.3.2  定量數據與類別數據
    1.3.3  大數據與小數據
  1.4  分類與回歸
  1.5  關於數據科學的電視節目
    The QuantShop
  1.6  關於實戰故事
  1.7  實戰故事:回答正確的問題
  1.8  章節註釋
  1.9  練習
第2章  數學基礎
  2.1  概率
    2.1.1  概率與統計
    2.1.2  複合事件與獨立事件
    2.1.3  條件概率
    2.1.4  概率分佈
  2.2  描述性統計
    2.2.1  中心性度量
    2.2.2  變異性度量
    2.2.3  解釋方差
    2.2.4  描述分佈
  2.3  相關性分析
    2.3.1  相關係數:皮爾遜和斯皮爾曼秩
    2.3.2  相關的強弱與顯著性
    2.3.3  相關性並不意味著因果關係
    2.3.4  用自相關檢測周期性
  2.4  對數
    2.4.1  對數與乘法概率
    2.4.2  對數和比率
    2.4.3  對數與正規化偏態分佈
  2.5  實戰故事:契合設計師基因
  2.6  章節註釋
  2.7  練習
第3章  數據整理
  3.1  數據科學語言
    3.1.1  notebook環境的重要性
    3.1.2  標準數據格式
  3.2  數據收集
    3.2.1  搜索
    3.2.2  爬取

    3.2.3  網路日誌
  3.3  數據清洗
    3.3.1  錯誤與偽影
    3.3.2  數據兼容性
    3.3.3  處理缺失值
    3.3.4  離群值檢測
  3.4  實戰故事:打敗市場
  ……
第4章  得分和排名
第5章  統計分析
第6章  數據可視化
第7章  數學模型
第8章  線性代數
第9章  線性回歸和logistic回歸
第10章  距離和網路方法
第11章  機器學習
第12章  大數據:實現規模
第13章  結尾
參考文獻
索引

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032