学習ロードマップ

SRE 入門

SLI / SLO / エラーバジェットを軸に、Google 発の信頼性工学を入門から応用まで 5 冊で実装レベルに落とす。

SREをはじめよう : 個人と組織による信頼性獲得への第一歩 SREの知識地図ーー基礎知識から現場での実践まで サイトリライアビリティワークブック : SREの実践方法 SREの探求 : 様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践 セキュアで信頼性のあるシステム構築 : Google SREが考える安全なシステムの設計、実装、保守
SCROLL TO BEGIN

このロードマップが扱うもの

- / - SLO - EM

このロードマップの全体像

対象読者

  • 本番運用の障害対応やオンコールに追われ、場当たり的な改善から抜け出したいインフラ / アプリエンジニア
  • SLO という言葉は聞くが、指標設計やエラーバジェット運用の具体像が掴めていない運用リーダー
  • 開発チームに信頼性文化を根付かせたい EM・テックリード、プラットフォームチーム担当者

5 冊で到達する状態

  • SLI / SLO / SLA とエラーバジェットの関係を自分の言葉で説明でき、サービスに当てはめて数値設計できる
  • トイル削減、ポストモーテム、オンコールといった SRE の基本プラクティスをチームに導入できる
  • モニタリング・アラート・キャパシティプランニングの原則を理解し、監視設計をレビューできる
  • 他社事例を踏まえ、自組織の規模と文化に合わせた SRE 導入ロードマップを描ける
  • セキュリティと信頼性を同じ設計軸で扱い、インシデント対応まで見据えたシステム設計ができる

進め方のヒント

  • 1 冊目で SRE のゴールと誤解を解き、2 冊目で知識を体系化してから実践に進む
  • 3 冊目のワークブックは章ごとに自社サービスへマッピングし、SLO 草案を起こしてみる
  • 4 冊目の各社事例は「自社規模との距離」を測る目的で読み、まるごと模倣しない

ロードマップ

5 つのステップで読み進める

  1. 01
    ステップ 01 個人と組織の両輪で始める SRE の第一歩
    SREをはじめよう : 個人と組織による信頼性獲得への第一歩
  2. 02
    ステップ 02 基礎用語から現場運用までの日本語知識地図
    SREの知識地図ーー基礎知識から現場での実践まで
  3. 03
    ステップ 03 SLO 設計と運用に落とす実践ワークブック
    サイトリライアビリティワークブック : SREの実践方法
  4. 04
    ステップ 04 各社事例で学ぶ SRE 導入パターンの地図
    SREの探求 : 様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践
  5. 05
    ステップ 05 信頼性とセキュリティを束ねるシステム設計
    セキュアで信頼性のあるシステム構築 : Google SREが考える安全なシステムの設計、実装、保守

第 1 章

個人と組織の両輪で始める SRE の第一歩

  1. 個人と組織の両輪で始める SRE の第一歩

    SRE という役割と文化の輪郭を掴む 1 冊目。個人のキャリア面と組織導入の両面から全体像を描き、以降の学習の視座を作る。

    SREをはじめよう : 個人と組織による信頼性獲得への第一歩
    この章の 1 冊 SREをはじめよう : 個人と組織による信頼性獲得への第一歩

    個人がSREになり、組織がSREを根付かせるための実践指針を得る

    この本で身につくこと
    • SREの本質的な思想(信頼性を機能として扱う)を概念ミスなく言語化できる
    • 個人がSREキャリアへ移行する際の準備事項・採用面接対策・日常業務の型を把握できる
    • トイルを定義・分類し、削減に向けた組織的な優先付けができる
    • 障害から学習する仕組み(ポストモーテム文化)を組織に導入する論理を説明できる

    想定読者: SREへのキャリアチェンジを検討しているインフラ・バックエンドエンジニア、およびSRE導入を推進または立て直ししたいエンジニアリングマネージャー・CTO

    本の詳細を見る →
  2. 基礎用語から現場運用までの日本語知識地図

    日本語で SRE の主要概念を網羅する体系書。SLI/SLO やトイルなどの語彙をここで整理し、ロードマップの背骨に据える。

    SREの知識地図ーー基礎知識から現場での実践まで
    この章の 1 冊 SREの知識地図ーー基礎知識から現場での実践まで

    北野勝久氏ほか日本の SRE 実務者たちによる、SRE(Site Reliability Engineering)の全体像と実践方法を 1 冊で俯瞰できる総合ガイド。

    この本で身につくこと
    • 「地図」としての構成: SLI/SLO、トイル削減、エラーバジェット、ポストモーテム、カオスエンジニアリングなど、SRE を構成する概念を網羅的に配置する。
    • 基礎と実践の両論: 体系的な知識解説だけでなく、実務で直面する課題に対するアプローチを具体例付きで示す。
    • 学習の導線: 今後の学習のための情報源(書籍、OSS、カンファレンス)が多数紹介されており、一冊で終わらずに次のステップへ繋げる。
    本の詳細を見る →
  3. SLO 設計と運用に落とす実践ワークブック

    Google SRE 本のペア実践編。章ごとの演習を通じて SLO 設計・ポストモーテム・キャパシティ計画を自サービスに適用する。

    サイトリライアビリティワークブック : SREの実践方法
    この章の 1 冊 サイトリライアビリティワークブック : SREの実践方法

    『サイトリライアビリティワークブック — SRE の実践方法』(原題『The Site Reliability Workbook』、Betsy Beyer ほか共著、2020 年 6 月邦訳、オライリー・ジャパン)は、Google が提唱…

    この本で身につくこと
    • SLI / SLO / エラーバジェット を組織で運用する所作が分かる — 数値設計の現場感
    • SRE と組織文化の関係が見える — 「SRE エンジニア」を作る前に文化を作る
    • インシデント管理のプロセスが分かる — Post-mortem / Blameless Culture
    • オンコール体制の設計が見える — ローテーション / アラート設計
    本の詳細を見る →
  4. 各社事例で学ぶ SRE 導入パターンの地図

    Microsoft / Netflix / Spotify 等の事例集として読む。規模や文化が違う各社の着地点から自組織の導入形を逆算する。

    SREの探求 : 様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践
    この章の 1 冊 SREの探求 : 様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践

    Google以外の各社がSREをどう導入・実践しているかを事例から学ぶ

    この本で身につくこと
    • Microsoft・Dropbox・Netflix・Lyft等の多様な組織がSREをどう導入し、どこで躓いたかを比較できる
    • SLOの設計・文化的定着・オンコール運用など、SREの各実践領域で組織ごとの選択の違いを把握できる
    • データベース信頼性エンジニアリングや機械学習との連携など、SRE周辺領域への横展開の視点を得られる
    • 心理的安全性・バーンアウト防止・オンコール文化など、SREの人間的側面を組織論として整理できる

    想定読者: SREを自組織に導入しようとしているエンジニアリングマネージャーやシニアエンジニア。Googleの原典SRE本を読み終えた後、実際の多様な組織文脈での適用方法を探している人。

    本の詳細を見る →
  5. 信頼性とセキュリティを束ねるシステム設計

    Google SRE が書く安全なシステム設計書。信頼性にセキュリティ観点を重ね、インシデント対応まで見据える応用到達点。

    セキュアで信頼性のあるシステム構築 : Google SREが考える安全なシステムの設計、実装、保守
    この章の 1 冊 セキュアで信頼性のあるシステム構築 : Google SREが考える安全なシステムの設計、実装、保守

    セキュリティと信頼性を統合してシステムをライフサイクル全体で設計する

    この本で身につくこと
    • セキュリティと信頼性がトレードオフではなく共通の設計原則を持つことを、設計・実装・保守の各フェーズで説明できる
    • 最小権限原則・多要素認証・緊急アクセス設計など、アクセス制御のパターンをリスク分類に基づいて選択できる
    • 深層防御・ブラストラジウス制御・フェイルオーバードメインなどレジリエンス設計の概念を自チームのアーキテクチャ議論に適用できる
    • コードレビュー・テスト・デプロイ・ログ収集の各工程でセキュリティチェックポイントを組み込む手順を把握できる

    想定読者: セキュリティと信頼性の両面を意識してシステムを設計・運用したいバックエンド・インフラエンジニア、SREチームのリード、エンジニアリングマネージャー

    本の詳細を見る →