幫助中心 | 我的帳號 | 關於我們

Java數據科學實戰/圖靈程序設計叢書

  • 作者:(美)邁克爾·R.布茹斯托維奇|責編:溫雪|譯者:姜建錦//趙緒營//張岩
  • 出版社:人民郵電
  • ISBN:9787115533302
  • 出版日期:2020/04/01
  • 裝幀:平裝
  • 頁數:186
人民幣:RMB 59 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書基於清晰的、面向對象的Java代碼,討論了數據科學研究的一些基本原理。考慮到項目所需的可伸縮性、穩健性以及便利性,Java是一門理想的語言。本書解釋了數據科學過程每個步驟背後的基本數學原理,以及如何將這些概念應用於Java。本書內容涉及數據輸入與輸出、線性代數、統計學、數據操作、學習與預測,以及Hadoop MapReduce在這個過程中所扮演的關鍵角色。書中還提供了在應用程序中使用的代碼示例。
    本書適合數據科學工作者以及希望提高數據科學技能的Java軟體工程師閱讀。

作者介紹
(美)邁克爾·R.布茹斯托維奇|責編:溫雪|譯者:姜建錦//趙緒營//張岩

目錄
前言
第1章  數據的輸入與輸出
  1.1  究竟何謂數據
  1.2  數據模型
    1.2.1  一維數組
    1.2.2  多維數組
    1.2.3  數據對象
    1.2.4  矩陣和向量
    1.2.5  JSON
  1.3  處理實際數據
    1.3.1  空值
    1.3.2  空格
    1.3.3  解析錯誤
    1.3.4  異常值
  1.4  管理數據文件
    1.4.1  首先理解文件內容
    1.4.2  讀取文本文件
    1.4.3  讀取JSON文件
    1.4.4  讀取圖像文件
    1.4.5  寫入文本文件
  1.5  掌握資料庫操作
    1.5.1  命令行客戶端
    1.5.2  結構化查詢語言
    1.5.3  Java資料庫連接
  1.6  通過繪圖將數據可視化
    1.6.1  創建簡單圖形
    1.6.2  混合類型圖的繪製
    1.6.3  把圖存入文件
第2章  線性代數
  2.1  構造向量和矩陣
    2.1.1  數組存儲
    2.1.2  塊存儲
    2.1.3  映射存儲
    2.1.4  訪問元素
    2.1.5  處理子陣
    2.1.6  隨機化
  2.2  向量與矩陣的運算
    2.2.1  縮放
    2.2.2  轉置
    2.2.3  加與減
    2.2.4  長度
    2.2.5  距離
    2.2.6  相乘
    2.2.7  內積
    2.2.8  外積
    2.2.9  逐項積
    2.2.10  複合運算
    2.2.11  仿射變換
    2.2.12  映射函數
  2.3  矩陣分解

    2.3.1  Cholesky分解
    2.3.2  LU分解
    2.3.3  QR分解
    2.3.4  奇異值分解
    2.3.5  特徵分解
    2.3.6  行列式
    2.3.7  矩陣逆
  2.4  求解線性方程組
第3章  統計學
  3.1  數據的概率起源
    3.1.1  概率密度
    3.1.2  累積概率
    3.1.3  統計矩
    3.1.4  熵
    3.1.5  連續分佈
    3.1.6  離散分佈
  3.2  數據集的特徵
    3.2.1  矩的計算
    3.2.2  描述性統計
    3.2.3  多元統計
    3.2.4  協方差與相關係數
    3.2.5  回歸
  3.3  處理大數據集
    3.3.1  累積統計
    3.3.2  統計結果的歸併
    3.3.3  回歸
  3.4  資料庫內置函數的應用
第4章  數據操作
  4.1  轉換文本數據
    4.1.1  從文檔中提取標記
    4.1.2  利用字典
    4.1.3  文檔向量化
  4.2  數值數據的縮放與歸一化
    4.2.1  對列進行縮放
    4.2.2  對行進行縮放
    4.2.3  矩陣的縮放運算元
  4.3  將數據降維至主成分
    4.3.1  協方差方法
    4.3.2  SVD方法
  4.4  創建訓練集、驗證集及測試集
    4.4.1  基於索引的重新採樣
    4.4.2  基於列表的重新採樣
    4.4.3  小批量
  4.5  標籤的編碼
    4.5.1  泛型編碼器
    4.5.2  一位有效編碼
第5章  學習與預測
  5.1  學習演算法
    5.1.1  迭代學習過程
    5.1.2  梯度下降優化方法

  5.2  評估學習過程
    5.2.1  損失函數最小化
    5.2.2  方差和的最小化
    5.2.3  輪廓係數
    5.2.4  對數似然性
    5.2.5  分類器的準確率
  5.3  無監督型學習
    5.3.1  K均值聚類
    5.3.2  DBSCAN
    5.3.3  高斯混合
  5.4  監督型學習
    5.4.1  樸素貝葉斯
    5.4.2  線性模型
    5.4.3  深度網路
第6章  Hadoop MapReduce
  6.1  Hadoop分散式文件系統
  6.2  MapReduce體系結構
  6.3  編寫MapReduce應用
    6.3.1  剖析MapReduce任務
    6.3.2  Hadoop數據類型
    6.3.3  映射器
    6.3.4  歸約器
    6.3.5  JSON字元串作為文本的簡單性
    6.3.6  部署技巧
  6.4  MapReduce示例
    6.4.1  單詞計數
    6.4.2  定製單詞計數
    6.4.3  稀疏線性代數
附錄A  數據集
作者簡介
關於封面

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032