幫助中心 | 我的帳號 | 關於我們

SRE原理與實踐(構建高可靠性互聯網應用)

  • 作者:張觀石|責編:陳潔
  • 出版社:機械工業
  • ISBN:9787111715825
  • 出版日期:2023/01/01
  • 裝幀:平裝
  • 頁數:257
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    這是一本從架構、開發、測試、運維全流程講解如何進行軟體可靠性工程建設的著作,它將幫助讀者構建針對軟體可靠性工程的完整的知識體系、工程體系和理論體系。
    本書作者是虎牙科技的SRE架構師,他基於20余年的架構、研發和運維經驗,用4年時間反覆打磨,代表中國的工程師總結了中國互聯網企業的SRE方法和經驗。本書得到了中國SRE奠基人、虎牙科技CEO以及華為、騰訊、阿里、B站、亞馬遜等企業的10余位技術專家高度評價並一致推薦。
    本書參考傳統可靠性工程及軟體可靠性工程體系,把傳統可靠性工程中的「六性」(可靠性、維修性、測試性、保障性、安全性、環境適應性)轉化為互聯網軟體可靠性工程的6種能力(可靠性設計能力、觀測能力、修復能力、保障能力、反脆弱能力、管理能力)。每一項能力都包括:互聯網SRE體系中的概念、能力的設計、能力建設的原則與方法、能力的度量與改進,以及相應的實踐案例。通過這6種能力把可靠性相關的工作組織起來,6種能力對應6個工作方向,不僅清晰地描繪出互聯網軟體可靠性工程體系的全貌,而且詳細闡述了每一種能力的獲得方法。
    本書基於傳統可靠性和軟體可靠性的研究成果,借鑒和應用它們的成熟理論和工程方法,結合互聯網軟體的實際情況並加以融合和改進,提出了一套符合互聯網時代的軟體可靠性工程方法。
    此外,本書還介紹了可靠性管理能力,對互聯網軟體開發團隊、運維團隊的技術領導者以及希望轉型為可靠性工程師的傳統運維人員、開發人員應該都有一定參考價值。

作者介紹
張觀石|責編:陳潔
    張觀石,資深運維專家和架構師,擁有20余年軟體開發、架構、運維、SRE經驗。目前就職于虎牙直播,歷任項目研發負責人、SRE負責人、架構師,虎牙事故管理委員會委員、基礎保障部架構師委員會委員。     為虎牙基於微服務架構的直播業務、音視頻業務、海外直播業務建立了穩定的保障體系,多次擔任虎牙「英雄聯盟全球總決賽直播」穩定性保障負責人。在混合多雲架構、可觀測性、預案、變更管控、AIOps等SRE領域有深入研究和豐富經驗。     同時,他也是中國信通院分散式系統穩定性實驗室高級技術專家,參與編寫了《信息系統穩定性保障能力建設指南》。《運維前線》一書的聯合作者。多次參與GOPS、MSUP、GDevops技術大會分享。

目錄
推薦序1
推薦序2
推薦序3
推薦序4
讚譽
前言
第1章  互聯網軟體可靠性概論
  1.1  為什麼要研究互聯網軟體可靠性工程
    1.1.1  大型互聯網企業的典型案例回顧
    1.1.2  研究互聯網服務可靠性的迫切性和重要性
    1.1.3  研究軟體可靠性工程是未來更複雜的軟體產品發展的需要
  1.2  什麼是可靠性工程
    1.2.1  可靠性與可靠性工程概述
    1.2.2  可靠性工程發展的3個階段
    1.2.3  傳統物理可靠性工程方法
  1.3  軟體可靠性工程
    1.3.1  軟體可靠性工程的概念
    1.3.2  軟體可靠性工程發展的兩個階段
  1.4  互聯網軟體的可靠性
    1.4.1  相關名詞介紹
    1.4.2  互聯網軟體可靠性工程現狀及挑戰
    1.4.3  互聯網軟體可靠性工程方法發展的3個階段
  1.5  互聯網軟體可靠性工程的工作思路
    1.5.1  理解軟體可靠性的3個核心問題
    1.5.2  建立可靠性工程體系框架的思路
  1.6  本章小結
第2章  互聯網軟體可靠性工程及可靠性度量
  2.1  軟體生命周期的可靠性工作
    2.1.1  互聯網軟體生命周期的可靠性工作及原則
    2.1.2  需求階段的可靠性工作
    2.1.3  設計與實現階段的可靠性工作
    2.1.4  測試與驗證階段的可靠性工作
    2.1.5  部署與發布階段的可靠性工作
    2.1.6  持續運行階段的可靠性工作
  2.2  故障生命周期的可靠性工作
    2.2.1  監控故障
    2.2.2  故障定界定位
    2.2.3  修復故障
  2.3  可靠性工程6種能力綜述
  2.4  互聯網軟體可靠性度量與評價
    2.4.1  可靠性度量介紹
    2.4.2  可靠性度量和分析方法
    2.4.3  軟體可靠性度量過程
    2.4.4  如何制定可靠性目標
  2.5  本章小結
第3章  互聯網軟體可靠性設計與分析
  3.1  為什麼要進行可靠性設計
    3.1.1  什麼是可靠性設計
    3.1.2  可靠性是設計出來的
  3.2  可靠性設計原則與通用方法

    3.2.1  可靠性設計的原則
    3.2.2  可靠性設計的4種方法
  3.3  軟體可靠性架構模型
  3.4  可靠性分析與架構風險
  3.5  可靠性分配
    3.5.1  可靠性分配的目的
    3.5.2  可靠性分配的原則
    3.5.3  可靠性分配的方法
  3.6  架構分層設計及其可靠性方法
    3.6.1  可靠性視角的分層架構
    3.6.2  業務架構的可靠性設計
    3.6.3  應用架構的可靠性設計
    3.6.4  系統架構的可靠性設計
    3.6.5  部署架構的可靠性設計
    3.6.6  基礎設施架構的可靠性設計
    3.6.7  可靠性相關能力的設計
  3.7  架構可靠性評審
    3.7.1  評審目的
    3.7.2  評審過程
    3.7.3  評審方法
  3.8  可靠性預計
  3.9  本章小結
第4章  可靠性觀測能力建設與實踐
  4.1  建設觀測能力的目的
  4.2  排查、監控、觀測技術的發展
    4.2.1  登錄伺服器通過系統命令排查問題
    4.2.2  集中式監控系統與日誌系統
    4.2.3  可觀測性
    4.2.4  觀測能力與監控
    4.2.5  建立綜合的觀測能力
  4.3  監控觀測的感知場景與感知方式
    4.3.1  業務可靠性感知
    4.3.2  影響範圍及原因定界定位
    4.3.3  幫助理解複雜系統結構並自動建模
    4.3.4  智能告警條件的數據感知
    4.3.5  根因推薦與排查診斷、決策
    4.3.6  容量感知與彈性
    4.3.7  人的感知與決策能力
    4.3.8  場景化的固化大盤
    4.3.9  巡檢與非實時分析
  4.4  觀測能力設計
    4.4.1  設計原則
    4.4.2  設計方法
  4.5  觀測能力要求與度量
    4.5.1  定性要求與分析
    4.5.2  定量要求與分析
  4.6  觀測能力建設實踐
  4.7  本章小結
第5章  故障修復、綜合保障能力建設與實踐
  5.1  軟體故障修復能力概述

    5.1.1  什麼是軟體故障修復能力
    5.1.2  修復能力是現代軟體系統的重要能力
    5.1.3  研究故障規律是修復能力的基礎
  5.2  軟體故障修復能力設計與建設
    5.2.1  設計原則
    5.2.2  預案平台的設計
    5.2.3  變更型故障快速修復
    5.2.4  災難型故障快速修復
    5.2.5  容量型故障快速修復
    5.2.6  應急協同
  5.3  運維保障能力
  5.4  修復能力的度量和要求
    5.4.1  定性要求
    5.4.2  定量要求與評估
  5.5  修復能力及保障能力建設實踐
    5.5.1  虎牙音視頻修復能力實踐
    5.5.2  預案平台建設實踐
    5.5.3  虎牙帶寬資源保障能力實踐
  5.6  本章小結
第6章  可靠性試驗與反脆弱能力建設與實踐
  6.1  互聯網軟體可靠性試驗與反脆弱能力概述
    6.1.1  什麼是可靠性試驗與反脆弱能力
    6.1.2  為什麼要反脆弱
  6.2  軟體系統的脆弱性因素分析
    6.2.1  環境、產品、人的關係
    6.2.2  脆弱性因素分析
  6.3  反脆弱能力建設與分析
    6.3.1  應對脆弱性的思路
    6.3.2  反脆弱能力建設原則
    6.3.3  環境脆弱性的可靠性試驗:混沌工程
    6.3.4  軟體系統自身的可靠性試驗:故障注入
    6.3.5  人為因素反脆弱設計:故障演練
    6.3.6  變更型故障反脆弱設計:變更管控
  6.4  可靠性試驗與反脆弱能力的要求
    6.4.1  定性要求
    6.4.2  定量要求
  6.5  實踐案例
  6.6  本章小結
第7章  可靠性管理能力
  7.1  可靠性管理工作概述
  7.2  軟體可靠性工作規劃及目標管理
  7.3  故障治理
    7.3.1  故障復盤
    7.3.2  故障評審定級
    7.3.3  定期回顧可靠性
  7.4  人員與團隊管理
    7.4.1  可靠性工程師團隊
    7.4.2  團隊轉型
  7.5  以SRE方式運維業務
    7.5.1  以SRE方式接手現有業務

    7.5.2  接手新業務
  7.6  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032