幫助中心 | 我的帳號 | 關於我們

大數據分析師面試筆試寶典

  • 作者:編者:周炎亮//劉志全//楚秦|責編:張淑謙//丁倫
  • 出版社:機械工業
  • ISBN:9787111712114
  • 出版日期:2022/08/01
  • 裝幀:平裝
  • 頁數:259
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    《大數據分析師面試筆試寶典》旨在幫助讀者了解大數據分析師的工作內容、技能要求、各類常用技術的原理和可能應用的場景。
    大數據分析是一個多學科交叉的領域,包含了統計學、電腦科學、運籌學乃至市場營銷學等。《大數據分析師面試筆試寶典》並沒有介紹大數據分析領域涉及的所有方面,而是根據當前用人單位對大數據分析師的需求,選擇了其中較為重要的內容進行解析,將當前大數據分析涉及的熱點技術一網打盡。
    閱讀《大數據分析師面試筆試寶典》需要具備一定的數理統計知識基礎和電腦編程背景。本書盡量不去證明一些在理論界已有的結論,而是用淺顯的語言來解釋複雜的公式,以便讀者更為輕鬆地掌握全書的知識,從而能夠從容面對面試以及日常工作。

作者介紹
編者:周炎亮//劉志全//楚秦|責編:張淑謙//丁倫

目錄
前言
第1章  面試經驗
  1.1  大數據分析技能要求
    1.1.1  數據分析師
    1.1.2  數據開發工程師
    1.1.3  數據挖掘工程師
    1.1.4  職業能力模型
  1.2  數據分析工作流程
    1.2.1  組織架構
    1.2.2  分析流程
  1.3  數據分析師臨場面試
    1.3.1  如何準備面試
    1.3.2  面試問題
  1.4  本章總結
第2章  統計學知識
  2.1  概率知識
    2.1.1  概率模型之間的關係解析
    2.1.2  概率相關面試題
    2.1.3  貝葉斯公式
  2.2  參數估計
    2.2.1  點估計
    2.2.2  區間估計
  2.3  假設檢驗
    2.3.1  假設檢驗原理
    2.3.2  兩類錯誤
    2.3.3  假設檢驗的常用方法
  2.4  抽樣技術解析
    2.4.1  樣本量影響因素分析
    2.4.2  假設檢驗樣本量計算
    2.4.3  參數估計樣本量計算
  2.5  馬爾可夫模型
    2.5.1  馬爾可夫過程原理
    2.5.2  馬爾可夫模型計算
  2.6  隱馬爾可夫模型
    2.6.1  HMM和三類問題
    2.6.2  求概率問題
    2.6.3  預測問題
    2.6.4  學習問題
  2.7  EM演算法
    2.7.1  基本思想
    2.7.2  演算法流程
  2.8  本章總結
第3章  數據挖掘演算法
  3.1  常用聚類演算法
    3.1.1  Kmeans演算法
    3.1.2  DBSCAN演算法
    3.1.3  聚類演算法評估
  3.2  常用分類演算法
    3.2.1  決策樹
    3.2.2  樸素貝葉斯

    3.2.3  KNN
    3.2.4  SVM
    3.2.5  邏輯回歸
    3.2.6  BP神經網路
  3.3  集成學習演算法
    3.3.1  Bagging原理
    3.3.2  隨機森林
    3.3.3  Boosting原理
    3.3.4  Adaboost演算法
    3.3.5  Stacking演算法
    3.3.6  分類演算法評估
    3.3.7  分類演算法小結
  3.4  關聯規則演算法
    3.4.1  Apriori
    3.4.2  Fp_Growth
    3.4.3  演算法評估
  3.5  數據降維演算法
    3.5.1  降維技術基本理論
    3.5.2  特徵選擇
    3.5.3  主成分分析
    3.5.4  SVD分解
    3.5.5  降維方法選擇
  3.6  數據升維方法
    3.6.1  分箱
    3.6.2  互動式特徵
  3.7  推薦演算法
    3.7.1  基於內容推薦
    3.7.2  基於用戶的協同過濾
    3.7.3  基於物品的協同過濾
    3.7.4  SVD推薦原理
    3.7.5  推薦演算法評估
  3.8  模型優化方法
    3.8.1  機器學習抽樣
    3.8.2  相似性度量
    3.8.3  損失函數
    3.8.4  過擬合與欠擬合
    3.8.5  正則化方法
    3.8.6  剪枝方法
    3.8.7  模型選擇
  3.9  本章總結
第4章  大數據技術解析
  4.1  數據埋點技術
    4.1.1  技術原理
    4.1.2  代碼埋點
    4.1.3  可視化埋點
    4.1.4  無埋點技術
    4.1.5  埋點需求分析
    4.1.6  選擇部署方式
  4.2  網路爬蟲技術
    4.2.1  聚焦爬蟲工作流程

    4.2.2  數據解析流程
    4.2.3  爬行策略
    4.2.4  網頁更新策略
  4.3  數據倉庫技術
    4.3.1  數倉名詞解析
    4.3.2  數據建模方法
    4.3.3  數倉建設原則
    4.3.4  SQL查詢
    4.3.5  SQL查詢優化
  4.4  ETL技術
    4.4.1  數據質量評估
    4.4.2  ETL流程
    4.4.3  缺失值處理方法
    4.4.4  異常值識別方法
  4.5  Hadoop技術
    4.5.1  Hadoop核心之HDFS
    4.5.2  Hadoop核心之MapReduce
    4.5.3  YARN
    4.5.4  WordCount源碼
    4.5.5  MapReduce優化
  4.6  Spark技術
    4.6.1  Spark集群運行
    4.6.2  Spark程序運行
    4.6.3  Spark RDD
    4.6.4  Spark存儲
    4.6.5  Spark內存管理
    4.6.6  Spark資源分配
    4.6.7  Spark Shuffle機制
    4.6.8  Spark的運算元調優
    4.6.9  數據傾斜問題解析
  4.7  本章總結
第5章  數據可視化
  5.1  圖表類型
  5.2  繪圖原則
  5.3  ECharts快速上手
    5.3.1  ECharts引入
    5.3.2  準備DOM容器
    5.3.3  柱狀圖示例
  5.4  本章總結
附錄
  附錄A  筆面試真題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032