学習ロードマップ
SLI / SLO / エラーバジェットを軸に、Google 発の信頼性工学を入門から応用まで 5 冊で実装レベルに落とす。
このロードマップが扱うもの
- 本番運用の障害対応やオンコールに追われ、場当たり的な改善から抜け出したいインフラ / アプリエンジニア - SLO という言葉は聞くが、指標設計やエラーバジェット運用の具体像が掴めていない運用リーダー - 開発チームに信頼性文化を根付かせたい EM・テックリード、プラットフォームチーム担当者
このロードマップの全体像
ロードマップ
第 1 章
SRE という役割と文化の輪郭を掴む 1 冊目。個人のキャリア面と組織導入の両面から全体像を描き、以降の学習の視座を作る。
日本語で SRE の主要概念を網羅する体系書。SLI/SLO やトイルなどの語彙をここで整理し、ロードマップの背骨に据える。
Google SRE 本のペア実践編。章ごとの演習を通じて SLO 設計・ポストモーテム・キャパシティ計画を自サービスに適用する。
Microsoft / Netflix / Spotify 等の事例集として読む。規模や文化が違う各社の着地点から自組織の導入形を逆算する。
Google SRE が書く安全なシステム設計書。信頼性にセキュリティ観点を重ね、インシデント対応まで見据える応用到達点。