內容簡介:「一本清晰明瞭的指南,適合任何想要了解軟體系統可觀測性真正含義的人。對於業內所有人來說,這都是一本重要的讀物!」
-Alex Hidalgo
Nobl9的首席可靠性倡導者,以及《Implementing Service Level Objectives》作者
可觀測性對於現代複雜軟體系統的構建、變更和理解是非常重要的。採用可觀測性的團隊能更快速自信地發布程式碼、識別異常行為和異常值,並了解每個使用者的體驗。本書詳細解釋了可觀測系統的價值,並向你展示如何實踐以可觀測性為驅動的開發。
作者Charity Majors、Liz Fong-Jones和George Miranda都是來自Honeycomb團隊,為你介紹了良好可觀測性的標準,展示如何改進你目前正在進行的工作,並提供從傳統工具(如指標、監控和日誌管理)遷移的實用技巧。你還將學習到可觀測性如何影響組織文化,以及組織文化如何反過來影響可觀測性。
本書將探索以下內容:
‧可觀測性的概念如何適用於大規模軟體管理
‧在交付複雜的雲端原生應用和系統時實踐可觀測性的價值
‧可觀測性對整個軟體開發生命週期的影響
‧不同的功能性團隊如何使用可觀察性來達成服務水平目標
‧如何為你的程式碼測量,以幫助未來的工程師理解你今日編寫的程式碼
‧如何編寫優質的程式碼,以進行具有前後因果知識系統的除錯和維護
‧如何使用豐富的數據分析來幫助你除錯棘手的問題
目錄
章節說明:第一部分 邁向可觀測性之路
第1章 什麼是可觀測性?
第2章 可觀測性與監控之間的除錯實踐有何不同?
第3章 沒有可觀測性的擴展教訓
第4章 可觀測性與DevOps、SRE 和Cloud Native 的關連
第二部分 可觀測性的基本原理
第5章 結構化事件是可觀測性的基礎
第6章 將事件串連成追蹤
第7章 使用OpenTelemetry 檢測
第8章 分析事件以實現可觀測性
第9章 可觀測性與監控如何配合?
第三部分 團隊的可觀測性
第10章 在團隊中應用可觀測性實踐
第11章 可觀測性驅動開發
第12章 使用服務水準目標來提高可靠性
第13章 基於SLO 的警報行動和除錯
第14章 可觀測性和軟體供應鏈
第四部分 大型系統中的可觀測性
第15章 購買和自己建立的抉擇以及投資報酬率
第16章 高效資料儲存
第17章 節省成本並保持足夠的準確性︰取樣
第18章 使用流水線進行遙測管理
第五部分 推廣可觀測性文化
第19章 可觀測性的業務案例
第20章 可觀測性的利益相關者和盟友
第21章 關於可觀測性的成熟度模型
第22章 接下來該何去何從?
章節說明:第一部分 邁向可觀測性之路
第1章 什麼是可觀測性?
第2章 可觀測性與監控之間的除錯實踐有何不同?
第3章 沒有可觀測性的擴展教訓
第4章 可觀測性與DevOps、SRE 和Cloud Native 的關連
第二部分 可觀測性的基本原理
第5章 結構化事件是可觀測性的基礎
第6章 將事件串連成追蹤
第7章 使用OpenTelemetry 檢測
第8章 分析事件以實現可觀測性
第9章 可觀測性與監控如何配合?
第三部分 團隊的可觀測性
第10章 在團隊中應用可觀測性實踐
第11章 可觀測性驅動開發
第12章 使用服務水準目標來提高可靠性
第13章 基於SLO 的警報行動和...