幫助中心 | 我的帳號 | 關於我們

數據科學面試通關

  • 作者:(美)萊昂德拉·R.岡薩雷斯|責編:賈小紅|譯者:劉璋
  • 出版社:清華大學
  • ISBN:9787302684534
  • 出版日期:2025/04/01
  • 裝幀:平裝
  • 頁數:330
人民幣:RMB 119 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書詳細闡述了與數據科學面試相關的基本解決方案,主要包括探索現代數據科學領域、在數據科學領域尋找工作、Python編程、數據可視化與數據敘述、使用SQL查詢資料庫、Linux中的Shell和Bash腳本編寫、使用Git進行版本控制、用概率和統計挖掘數據、理解特徵工程和為建模準備數據、精通機器學習概念、用深度學習構建網路、用MLOps實現機器學習解決方案、掌握面試環節、協商薪酬等內容。此外,本書還提供了相應的示例、代碼,以幫助讀者進一步理解相關方案的實現過程。
    本書適合作為高等院校電腦及相關專業的教材和教學參考書,也可作為相關開發人員的自學用書和參考手冊。

作者介紹
(美)萊昂德拉·R.岡薩雷斯|責編:賈小紅|譯者:劉璋

目錄
第1篇  進入數據科學領域
  第1章    探索現代數據科學領域
    1.1    數據科學是什麼
    1.2    探索數據科學過程
      1.2.1    數據收集
      1.2.2    數據探索
      1.2.3  數據建模
      1.2.4  模型評估
      1.2.5  模型部署和監控
    1.3  分析數據科學的不同類型
      1.3.1  數據工程師
      1.3.2  儀錶板和可視化專家
      1.3.3  機器學習專家
      1.3.4  領域專家
    1.4  審視數據科學的職業路徑
      1.4.1  傳統型數據科學家
      1.4.2  領域專家型數據科學家
      1.4.3  非傳統路徑數據科學家
    1.5  解決經驗瓶頸問題
      1.5.1  學術經驗
      1.5.2  工作經驗
    1.6  理解預期的技能和能力
      1.6.1  硬技能(技術技能)
      1.6.2  軟技能(溝通技能)
    1.7  探索數據科學的演變
      1.7.1  新模型
      1.7.2  新環境
      1.7.3  新計算
      1.7.4  新應用
    1.8  本章小結
    1.9  參考文獻
  第2章  在數據科學領域尋找工作
    2.1  尋找第一份數據科學工作
      2.1.1  準備前行
      2.1.2  尋找招聘板
      2.1.3  構建出色的作品集
      2.1.4  申請工作
    2.2  製作金牌簡歷
      2.2.1  完美簡歷的神話
      2.2.2  理解自動化簡歷篩選
      2.2.3  打造有效的簡歷
      2.2.4  格式和組織
      2.2.5  使用正確的術語
    2.3  準備獲得面試機會
      2.3.1  摩爾定律
      2.3.2  研究、研究、再研究
      2.3.3  品牌塑造
    2.4  本章小結
    2.5  參考文獻
第2篇  操控和管理數據

  第3章  Python編程
    3.1  變數、數據類型和數據結構
    3.2  Python中的索引
    3.3  字元串操作
      3.3.1  初始化字元串
      3.3.2  字元串索引
    3.4  使用Python控制語句和列表推導
      3.4.1  條件語句
      3.4.2  循環語句
      3.4.3  列表推導
    3.5  使用用戶定義的函數
      3.5.1  用戶定義的函數的語法
      3.5.2  使用用戶定義的函數進行操作
      3.5.3  熟悉lambda函數
      3.5.4  創建優秀的函數
    3.6  在Python中處理文件
    3.7  使用pandas整理數據
      3.7.1  處理缺失數據
      3.7.2  選擇數據
      3.7.3  排序數據
      3.7.4  合併數據
      3.7.5  使用groupby()進行聚合
    3.8  本章小結
    3.9  參考文獻
  第4章  數據可視化與數據敘述
    4.1  理解數據可視化
      4.1.1  條形圖
      4.1.2  折線圖
      4.1.3  散點圖
      4.1.4  直方圖
      4.1.5  密度圖
      4.1.6  分位數-分位數圖(Q-Q圖)
      4.1.7  箱線圖
      4.1.8  餅圖
    4.2  調查行業工具
      4.2.1  PowerBI
      4.2.2  Tableau
      4.2.3  Shiny
      4.2.4  ggplot2(R)
      4.2.5  Matplotlib(Python)
      4.2.6  Seaborn(Python)
    4.3  開發儀錶板、報告和關鍵績效指標
    4.4  開發圖表和圖形
      4.4.1  條形圖——Matplotlib
      4.4.2  條形圖——Seaborn
      4.4.3  散點圖——Matplotlib
      4.4.4  散點圖——Seaborn
      4.4.5  直方圖——Matplotlib
      4.4.6  直方圖——Seaborn
    4.5  應用基於情景的敘事

    4.6  本章小結
  第5章  使用SQL查詢資料庫
    5.1  介紹關係資料庫
    5.2  掌握SQL基礎知識
      5.2.1  SELECT語句
      5.2.2  WHERE子句
      5.2.3  ORDERBY子句
    5.3  使用GROUPBY和HAVING聚合數據
      5.3.1  GROUPBY子句
      5.3.2  HAVING子句
    5.4  使用CASEWHEN創建欄位
    5.5  分析子查詢和CTE
      5.5.1  SELECT子句中的子查詢
      5.5.2  FROM子句中的子查詢
      5.5.3  WHERE子句中的子查詢
      5.5.4  HAVING子句中的子查詢
      5.5.5  區分公用表表達式(CTE)和子查詢
    5.6  使用連接合併表格
      5.6.1  內連接
      5.6.2  左連接和右連接
      5.6.3  全外連接
      5.6.4  多表連接
    5.7  計算窗口函數
      5.7.1  OVER、ORDERBY、PARTITION和SET
      5.7.2  LAG和LEAD
      5.7.3  ROW_NUMBER
      5.7.4  RANK和DENSE_RANK
      5.7.5  使用日期函數
    5.8  處理複雜查詢
    5.9  本章小結
  第6章  Linux中的Shell和Bash腳本編寫
    6.1  操作系統簡介
    6.2  導航系統目錄
      6.2.1  介紹基本命令行提示符
      6.2.2  理解目錄類型
    6.3  文件和目錄操作
    6.4  使用Bash進行腳本編寫
    6.5  介紹控制語句
    6.6  創建函數
    6.7  數據處理和管道
    6.8  使用cron
    6.9  本章小結
  第7章  使用Git進行版本控制
    7.1  介紹倉庫
    7.2  創建倉庫
      7.2.1  克隆現有的遠程倉庫
      7.2.2  從頭開始創建本地倉庫
      7.2.3  將本地倉庫和遠程倉庫關聯
    7.3  詳解數據科學家的Git工作流程
    7.4  在數據科學中使用Git標籤

      7.4.1  理解Git標籤
      7.4.2  作為數據科學家使用標籤
    7.5  理解常見操作
    7.6  本章小結
第3篇  探索人工智慧
  第8章  用概率和統計挖掘數據
    8.1  用描述性統計描述數據
      8.1.1  測量中心趨勢
      8.1.2  測量變異性
    8.2  介紹總體和樣本
      8.2.1  定義總體和樣本
      8.2.2  代表性樣本
      8.2.3  減少抽樣誤差
    8.3  理解中心極限定理
      8.3.1  中心極限定理
      8.3.2  證明正態性假設
    8.4  用抽樣分佈塑造數據
      8.4.1  概率分佈
      8.4.2  均勻分佈
      8.4.3  正態分佈和學生t分佈
      8.4.4  二項分佈
      8.4.5  泊松分佈
      8.4.6  指數分佈
      8.4.7  幾何分佈
      8.4.8  威布爾分佈
    8.5  假設檢驗
      8.5.1  理解單樣本t檢驗
      8.5.2  理解雙樣本t檢驗
      8.5.3  理解配對樣本t檢驗
      8.5.4  理解方差分析和多元方差分析
      8.5.5  卡方檢驗
      8.5.6  A/B測試
    8.6  理解Ⅰ型錯誤和Ⅱ型錯誤
      8.6.1  Ⅰ型錯誤(假陽性)
      8.6.2  Ⅱ型錯誤(假陰性)
      8.6.3  尋求平衡
    8.7  本章小結
    8.8  參考文獻
  第9章  理解特徵工程和為建模準備數據
    9.1  理解特徵工程
      9.1.1  避免數據泄漏
      9.1.2  處理缺失數據
      9.1.3  數據縮放
    9.2  應用數據轉換
      9.2.1  引入數據轉換
      9.2.2  對數轉換
      9.2.3  冪次轉換
      9.2.4  Box-Cox轉換
      9.2.5  指數轉換
    9.3  處理分類數據和其他特徵

      9.3.1  獨熱編碼
      9.3.2  標籤編碼
      9.3.3  目標編碼
      9.3.4  計算欄位
    9.4  執行特徵選擇
      9.4.1  特徵選擇的類型
      9.4.2  遞歸特徵消除
      9.4.3  L1正則化
      9.4.4  基於樹的特徵選擇
      9.4.5  方差膨脹因子
    9.5  處理不平衡數據
      9.5.1  理解不平衡數據
      9.5.2  處理不平衡數據
    9.6  降低維度
      9.6.1  主成分分析
      9.6.2  奇異值分解
      9.6.3  t-SNE
      9.6.4  自編碼器
    9.7  本章小結
  第10章  精通機器學習概念
    10.1  介紹機器學習工作流程
      10.1.1  問題陳述
      10.1.2  模型選擇
      10.1.3  模型調整
      10.1.4  模型預測
    10.2  監督機器學習
      10.2.1  回歸與分類
      10.2.2  線性回歸——回歸
      10.2.3  邏輯回歸
      10.2.4  k-最近鄰(k-NN)
      10.2.5  隨機森林
      10.2.6  極端梯度提升(XGBoost)
    10.3  無監督機器學習
      10.3.1  K-means
      10.3.2  具有雜訊的基於密度的聚類應用(DBSCAN)
      10.3.3  其他聚類演算法
      10.3.4  評估聚類
    10.4  總結其他值得注意的機器學習模型
    10.5  理解偏差-方差權衡
    10.6  超參數調整
      10.6.1  網格搜索
      10.6.2  隨機搜索
      10.6.3  貝葉斯優化
    10.7  本章小結
  第11章  用深度學習構建網路
    11.1  介紹神經網路和深度學習
    11.2  討論權重和偏差
      11.2.1  權重介紹
      11.2.2  偏差介紹
    11.3  使用激活函數激活神經元

      11.3.1  常見激活函數
      11.3.2  選擇合適的激活函數
    11.4  剖析反向傳播
      11.4.1  梯度下降
      11.4.2  什麼是反向傳播
      11.4.3  損失函數
      11.4.4  梯度下降步驟
      11.4.5  梯度消失問題
    11.5  使用優化器
      11.5.1  優化演算法
      11.5.2  網路調整
    11.6  理解嵌入
      11.6.1  詞嵌入
      11.6.2  訓練嵌入
    11.7  列出常見的網路架構
      11.7.1  常見網路
      11.7.2  工具和包
    11.8  介紹GenAI和LLM
      11.8.1  揭示語言模型
      11.8.2  Transformer和自注意力
      11.8.3  遷移學習
      11.8.4  GPT應用
    11.9  本章小結
  第12章  用MLOps實現機器學習解決方案
    12.1  引入MLOps
    12.2  理解數據採集
    12.3  學習數據存儲的基礎知識
    12.4  審查模型開發
    12.5  模型部署的打包
      12.5.1  確定要求
      12.5.2  虛擬環境
      12.5.3  環境管理的工具和方法
    12.6  使用容器部署模型
    12.7  驗證和監控模型
      12.7.1  驗證模型部署
      12.7.2  模型監控
      12.7.3  思考治理
    12.8  使用AzureML的MLOps
    12.9  本章小結
第4篇  獲得工作
  第13章  掌握面試環節
    13.1  掌握與招聘人員的早期互動
    13.2  掌握不同的面試階段
      13.2.1  招聘經理階段
      13.2.2  技術面試
      13.2.3  編碼問題
      13.2.4  小組面試階段
    13.3  本章小結
    13.4  參考文獻
  第14章  協商薪酬

    14.1  理解薪酬格局
    14.2  談判報價
      14.2.1  談判考慮因素
      14.2.2  回應報價
      14.2.3  最大可談判薪酬和情境價值
    14.3  本章小結
    14.4  最後的話

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032