幫助中心 | 我的帳號 | 關於我們

大數據技術架構(核心原理與應用實踐)

  • 作者:李智慧|責編:劉皎
  • 出版社:電子工業
  • ISBN:9787121414183
  • 出版日期:2021/07/01
  • 裝幀:平裝
  • 頁數:197
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    在人工智慧時代,不論是否從事大數據開發,掌握大數據的原理和架構早已成為每個工程師的必備技能。本書結合作者多年大數據開發、應用的經驗,深入淺出地闡述大數據的完整知識體系,幫助讀者從不同視角找到大數據方向的突破口,真正從普通開發者晉陞為擁有大數據思維並能解決複雜問題的技術專家。
    本書一共分為7章,分別是大數據的前世今生與應用場景、Hadoop大數據原理與架構、大數據生態體系主要產品原理與架構、大數據開發實踐、大數據平台與系統集成、大數據分析與運營、大數據演算法與機器學習。
    本書既可作為初學者了解大數據技術的入門指南,也可作為有一定經驗的工程師深入理解大數據思維的有益參考。

作者介紹
李智慧|責編:劉皎
    李智慧,資深架構專家,同程旅行交通首席架構師,曾在NEC、阿里巴巴、Intel等知名企業擔任架構師,也曾在WiFi萬能鑰匙等企業擔任CTO。     長期從事大數據、大型網站的架構和研發工作,領導設計過多個日活用戶在千萬級以上的互聯網系統架構,實戰經驗豐富。曾設計、開發過Web伺服器防火牆、分散式NoSQL系統、大數據倉庫引擎、反應式編程框架等各種類型的軟體系統。     Apache Spark代碼貢獻者,騰訊雲TVP,著有暢銷書《大型網站技術架構》,同時也是極客時間《從0開始學大數據》《後端技術面試38講》等專欄的作者。

目錄
1  大數據的前世今生與應用場景
  大數據的前世今生:大數據簡史與大數據生態體系概述
  從搜索引擎到人工智慧:大數據應用發展史
    大數據應用的搜索引擎時代
    大數據應用的數據倉庫時代
    大數據應用的數據挖掘時代
    大數據應用的機器學習時代
  數據驅動一切:大數據全領域應用場景分析
    大數據在醫療健康領域的應用
    大數據在社交媒體領域的應用
    大數據在金融領域的應用
    大數據在新零售領域的應用
    大數據在交通領域的應用
2  Hadoop大數據原理與架構
  移動計算比移動數據更划算
  從RAID看垂直伸縮到水平伸縮的演化
  新技術層出不窮,HDFS依然是存儲的王者
  為什麼說MapReduce既是編程模型又是計算框架
  MapReduce如何讓數據完成一次旅行
    MapReduce作業啟動和運行機制
    MapReduce數據合併與連接機制
  為什麼把Yarn稱為資源調度框架
  程序員應該如何學好大數據技術
3  大數據生態體系主要產品原理與架構
  Hive是如何讓MapReduce實現SQL操作的
    用MapReduce實現SQL數據分析的原理
    Hive的架構
    Hive如何實現join操作
  人們並沒有覺得MapReduce速度慢,直到Spark出現
  同樣的本質,為何Spark可以更高效
    Spark的計算階段
    Spark的作業管理
    Spark的執行過程
  BigTable的開源實現:HBase
    HBase可伸縮架構
    HBase可擴展數據模型
    HBase的高性能存儲
  流式計算的代表:Storm、Spark Streaming、Flink
    Storm
    Spark Streaming
    Flink
  ZooKeeper是如何保證數據一致性的
    分散式一致性原理
    Paxos演算法與ZooKeeper架構
  大數據技術應用場景分析
4  大數據開發實踐
  如何自己開發一個大數據SQL引擎
    Panthera架構
    Panthera的SQL語法轉換
    比如這條SQL

    Panthera程序設計
  Spark的性能優化案例分析
    Apache開源社區的組織和參與方式
    軟體性能優化
    大數據開發的性能優化
    Spark性能優化
    案例1:Spark任務文件初始化調優
    案例2:Spark任務調度優化
    案例3:Spark應用配置優化
    案例4:操作系統配置優化
    案例5:硬體優化
  大數據基準測試可以帶來什麼好處
    大數據基準測試的應用
    大數據基準測試工具HiBench
  從大數據性能測試工具Dew看如何快速開發大數據系統
    Dew設計與開發
    Akka的原理與應用
  大數據開發實踐的啟示
5  大數據平台與系統集成
  大數據平台=互聯網產品+大數據產品
    數據採集
    數據處理
    數據輸出與展示
    大數據任務調度
    大數據平台Lamda架構
    數據在大數據平台中的流轉
  大數據從哪裡來
    從資料庫導入
    從日誌文件導入
    前端埋點採集
    爬蟲系統
    數據的熵
  知名大廠如何搭建大數據平台
    淘寶大數據平台
    美團大數據平台
    滴滴大數據平台
    學架構就是學架構模式
  盤點可供中小企業參考的商業大數據平台
    大數據解決方案提供商
    大數據云計算服務商
    大數據SaaS服務商
    大數據開放平台
  當大數據遇上物聯網
    物聯網應用場景分析
    物聯網平台架構
    大數據技術在物聯網中的應用
6  大數據分析與運營
  老闆想要監控什麼運營指標
    互聯網運營的常用數據指標
    數據可視化圖表與數據監控

  一個用戶新增下降的數據分析案例
    數據分析案例
    數據分析方法
  A/B測試與灰度發布必知必會
    A/B測試的過程
    A/B測試的系統架構
    灰度發布
  如何利用大數據成為「增長黑客」
    Hotmail的增長黑客故事
    AARRR用戶增長模型
    利用大數據增長用戶數量
  為什麼說數據驅動運營
7  大數據演算法與機器學習
  如何對數據進行分類和預測
    k近鄰分類演算法
    數據的距離
    文本的特徵值
    貝葉斯分類
  如何發掘數據的關係
    搜索排序
    關聯分析
    聚類
  如何預測用戶的喜好
    基於人口統計的推薦
    基於商品屬性的推薦
    基於用戶的協同過濾推薦
    基於商品的協同過濾推薦
  機器學習的數學原理是什麼
    樣本
    模型
    演算法
  為什麼學機器學習要學數學
  從感知機到神經網路
    感知機
    神經網路

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032