幫助中心 | 我的帳號 | 關於我們

數據科學導論(基於Python語言微課版高等院校十三五規劃教材)/Python系列

  • 作者:編者:朝樂門|責編:孫燕燕
  • 出版社:人民郵電
  • ISBN:9787115548207
  • 出版日期:2021/01/01
  • 裝幀:平裝
  • 頁數:202
人民幣:RMB 42 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書重點講解數據科學的核心理論與實踐應用。全書共7章,主要介紹數據科學的基礎理論、統計學與模型、機器學習與演算法、數據可視化、數據加工、大數據技術、數據產品開發及數據科學中的人文與管理等內容。本書內容通俗易懂,深入淺出,便於讀者理解。
    本書可作為數據科學與大數據技術、大數據管理與應用、電腦科學與技術、管理科學與工程、工商管理、數據統計、數據分析、信息管理與信息系統、商業分析等多個專業的教材,也可作為數據科學從業人士的參考用書。

作者介紹
編者:朝樂門|責編:孫燕燕
    朝樂門,1979年生,中國人民大學數據工程與知識工程教育部重點實驗室、信息資源管理學院副教授,博士生導師;章魚大數據首席數據科學家:中國電腦學會信息系統專委員會委員、ACM高級會員、國際知識管理協會正式委員、全國高校大數據教育聯盟大數據教材專家指導委員會委員;獲得北京市中青年骨幹教師稱號、國際知識管理與智力資本傑出成就獎、Emerald/EFMD國際傑出博士論文獎、國家自然科學基金項目優秀項目、中國大數據學術創新獎和中國大數據創新百人等多種獎勵30余項。朝樂門是我國第一部系統闡述數據科學理念、理論、方法、技術和工具的重要專著——《數據科學》(清華大學出版社,2016)的作者。

目錄
第1章  數據科學的基礎理論
  1.1  為什麼要學習數據科學
  1.2  數據科學的定義
  1.3  數據科學的知識體系
  1.4  數據科學的基本流程
  1.5  數據科學與其他學科的區別
    1.5.1  學科定位
    1.5.2  研究視角
    1.5.3  研究範式
  1.6  數據科學的人才類型
  1.7  數據科學的常用工具
  1.8  數據科學的相關應用
  1.9  繼續學習本章知識
  習題
第2章  統計學與模型
  2.1  統計學與數據科學
    2.1.1  描述統計與推斷統計
    2.1.2  基本分析法和元分析法
  2.2  統計方法的選擇思路
  2.3  數據劃分及準備方法
    2.3.1  自變數與因變數
    2.3.2  數據抽樣
  2.4  參數估計與假設檢驗
    2.4.1  參數估計
    2.4.2  假設檢驗
  2.5  常用統計方法及選擇
    2.5.1  相關分析
    2.5.2  回歸分析
    2.5.3  方差分析
    2.5.4  分類分析
    2.5.5  聚類分析
    2.5.6  時間序列分析
    2.5.7  關聯規則分析
  2.6  統計學面臨的挑戰
  2.7  Python編程實踐
  2.8  繼續學習本章知識
  習題
第3章  機器學習與演算法
  3.1  數據科學與機器學習
  3.2  機器學習的應用步驟
  3.3  數據劃分及準備方法
  3.4  演算法類型及選擇方法
  3.5  模型的評估方法
  3.6  機器學習面臨的挑戰
  3.7  Python編程實踐
  3.8  繼續學習本章知識
  習題
第4章  數據可視化
  4.1  數據科學與數據可視化
  4.2  數據可視化的基本原則

  4.3  視覺編碼與數據類型
  4.4  可視分析學
  4.5  常用統計圖表
  4.6  數據可視化的發展趨勢
  4.7  Python編程實踐
  4.8  繼續學習本章知識
  習題
第5章  數據加工
  5.1  數據科學與數據加工
  5.2  探索性數據分析
  5.3  數據大小及標準化
  5.4  缺失數據及其處理方法
  5.5  雜訊數據及其處理方法
    5.5.1  離群點處理
    5.5.2  分箱處理
  5.6  數據維度及其降維處理方法
    5.6.1  特徵選擇
    5.6.2  主成分分析
  5.7  數據脫敏及其處理方法
  5.8  數據形態及其規整化方法
  5.9  Python編程實踐
  5.10  繼續學習本章知識
  習題
第6章  大數據技術
  6.1  數據科學與大數據技術
  6.2  Hadoop生態系統
  6.3  大數據計算技術與Spark
    6.3.1  大數據計算與Lambda架構
    6.3.2  Spark的出現及其特點
    6.3.3  Spark的計算流程
    6.3.4  Spark的關鍵技術
  6.4  大數據管理技術與MongoDB
    6.4.1  關係資料庫及其優缺點
    6.4.2  NoSQL及其數據模型
    6.4.3  CAP理論與BASE原則
    6.4.4  分片技術與複製技術
    6.4.5  MongoDB
  6.5  大數據分析技術
    6.5.1  Analytics 3.0
    6.5.2  Gartner分析學價值扶梯模型
    6.5.3  數據分析中的陷阱
  6.6  Python編程實踐
  6.7  繼續學習本章知識
  習題
第7章  數據產品開發及數據科學中的人文與管理
  7.1  數據產品開發及數據科學的人文與管理屬性
  7.2  數據產品及開發
  7.3  數據科學的項目管理
    7.3.1  數據科學項目中的主要角色
    7.3.2  數據科學項目中的主要活動

  7.4  數據能力
    7.4.1  關鍵過程域
    7.4.2  成熟度等級
    7.4.3  成熟度評價
  7.5  數據治理
    7.5.1  主要內容
    7.5.2  基本過程
    7.5.3  參考框架
  7.6  數據安全
    7.6.1  信息系統安全等級保護
    7.6.2  P2DR模型
  7.7  數據偏見
    7.7.1  數據來源選擇偏見
    7.7.2  數據加工和準備偏見
    7.7.3  演算法與模型選擇偏見
    7.7.4  分析結果的解讀和呈現上的偏見
  7.8  數據倫理與道德
  7.9  繼續學習本章知識
  習題
術語索引
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032