学習ロードマップ

オブザーバビリティと監視

ログ・メトリクス・トレースの三本柱を、業務システムで回せる形に整えるためのロードマップ。SRE や運用担当者向け。

実践 OpenTelemetry : オープンなオブザーバビリティ標準を組織に導入する 入門 OpenTelemetry : 現代的なオブザーバビリティシステムの構築と運用 New Relic実践入門 第2版 オブザーバビリティの基礎と実現 AWS継続的セキュリティ実践ガイド ログの収集/分析による監視体制の構築 オブザーバビリティ・エンジニアリング 監視資本主義 : 人類の未来を賭けた闘い
SCROLL TO BEGIN

このロードマップが扱うもの

SRE

このロードマップの全体像

このロードマップは、本番システムの「何が起きているか」を把握する基盤を整えたい SRE・バックエンド・プラットフォームエンジニアを対象にしています。学び終えたときには、ログ・メトリクス・トレースの三本柱を設計し、アラート基準と障害対応フローまで含めて、チームが安心して運用できる監視基盤を提案・実装できる状態を目指します。

学習ステップ

1. 監視とオブザーバビリティの違い: 既知の異常を検知する監視と、未知の振る舞いを説明できる状態のオブザーバビリティを区別します。 2. メトリクス設計: RED / USE などのパターン、SLI/SLO、カーディナリティの管理、ヒストグラムの使い方を押さえます。 3. ログ設計と集約: 構造化ログ、相関 ID、ログレベル、保存期間とコストのバランスをルール化します。 4. 分散トレーシング: サービス境界を跨ぐリクエスト追跡、サンプリング、スパン属性の設計を学びます。 5. アラートとオンコール運用: 症状ベースのアラート、ノイズ対策、ランブック、ポストモーテム文化を整えます。 6. コストとガバナンス: テレメトリ量の管理、保存期間、テナントやサービスごとの責務分担を仕組み化します。

注意点と周辺知識

「全部取る」は運用コストとノイズを爆発させ、結果的に何も見ない状態を作ります。SLO と連動させ「何を見て何を見ないか」を決める方針づくりがまず重要です。アラートは増やすより減らす方が難しく、ノイズの多いアラートは現場の注意を削り最終的に無視されます。周辺では、Linux とネットワークの基礎、クラウド / コンテナ / Kubernetes、主要な OSS / SaaS 監視スタック、可視化(ダッシュボード)、障害対応とインシデントマネジメント、コスト管理を並行して理解しておくと、ツール選定と運用ルールが具体化します。

ロードマップ

6 つのステップで読み進める

  1. 01
    ステップ 01 実践 OpenTelemetry : オープンなオブザーバビリティ標準を組織に導入する
    実践 OpenTelemetry : オープンなオブザーバビリティ標準を組織に導入する
  2. 02
    ステップ 02 入門 OpenTelemetry : 現代的なオブザーバビリティシステムの構築と運用
    入門 OpenTelemetry : 現代的なオブザーバビリティシステムの構築と運用
  3. 03
    ステップ 03 New Relic実践入門 第2版 オブザーバビリティの基礎と実現
    New Relic実践入門 第2版 オブザーバビリティの基礎と実現
  4. 04
    ステップ 04 AWS継続的セキュリティ実践ガイド ログの収集/分析による監視体制の構築
    AWS継続的セキュリティ実践ガイド ログの収集/分析による監視体制の構築
  5. 05
    ステップ 05 オブザーバビリティ・エンジニアリング
    オブザーバビリティ・エンジニアリング
  6. 06
    ステップ 06 監視資本主義 : 人類の未来を賭けた闘い
    監視資本主義 : 人類の未来を賭けた闘い

第 1 章

実践 OpenTelemetry : オープンなオブザーバビリティ標準を組織に導入する

  1. 実践 OpenTelemetry : オープンなオブザーバビリティ標準を組織に導入する

    実践 OpenTelemetry : オープンなオブザーバビリティ標準を組織に導入する
    この章の 1 冊 実践 OpenTelemetry : オープンなオブザーバビリティ標準を組織に導入する

    OpenTelemetry の全シグナルを実装し、組織横断で導入する

    この本で身につくこと
    • 分散トレース・メトリクス・ログ・プロファイルの 4 シグナルを OpenTelemetry API/SDK で計装できる
    • OpenTelemetry Collector の receiver / processor / exporter パイプラインを設計・構成できる
    • Java エージェントによる自動計装と手動計装の使い分け判断基準を説明できる
    • OTLP プロトコルと Context Propagation の仕組みを理解し、バックエンドに依存しない計装設計ができる

    想定読者: マイクロサービスや Kubernetes を本番運用する SRE・バックエンドエンジニアで、テレメトリー基盤の標準化を推進したい人

    本の詳細を見る →
  2. 入門 OpenTelemetry : 現代的なオブザーバビリティシステムの構築と運用

    入門 OpenTelemetry : 現代的なオブザーバビリティシステムの構築と運用
    この章の 1 冊 入門 OpenTelemetry : 現代的なオブザーバビリティシステムの構築と運用

    OpenTelemetry でクラウドネイティブなオブザーバビリティ基盤を構築・運用する

    この本で身につくこと
    • 分散トレース・メトリクス・ログ・プロファイルという 4 種のテレメトリーシグナルの役割と相互補完を説明できる
    • OpenTelemetry Collector を用いたテレメトリーパイプラインの設計と管理ができる
    • ベンダーロックインを回避する標準化されたインストゥルメンテーション戦略を立案できる
    • アプリケーションコードへの自動・手動計装の違いを理解し、言語別ライブラリを選択できる

    想定読者: クラウドネイティブなシステムに携わる SRE・DevOps エンジニア・バックエンドエンジニアで、分散トレース・メトリクス・ログを統合した観測基盤を整備したい人

    本の詳細を見る →
  3. New Relic実践入門 第2版 オブザーバビリティの基礎と実現

    New Relic実践入門 第2版 オブザーバビリティの基礎と実現
    この章の 1 冊 New Relic実践入門 第2版 オブザーバビリティの基礎と実現

    New Relicを軸にオブザーバビリティを設計・運用に定着させる

    この本で身につくこと
    • オブザーバビリティとモニタリングの概念的差異を説明し、なぜ次世代運用監視が必要かを根拠をもって語れる
    • New RelicのAPM・インフラ・ブラウザ・Synthetic Monitoring・ログ管理を実際のサービスに設定・活用できる
    • アラートとAI機能を組み合わせて異常検知とインシデント初動を自動化できる
    • マイクロサービスやKubernetes環境でのトラブルシューティングにNew Relicのトレーシングを適用できる

    想定読者: 大規模なサービス開発・運用に携わり、従来の監視から脱却してオブザーバビリティを実践したいSREやインフラエンジニア

    本の詳細を見る →
  4. AWS継続的セキュリティ実践ガイド ログの収集/分析による監視体制の構築

    AWS継続的セキュリティ実践ガイド ログの収集/分析による監視体制の構築
    この章の 1 冊 AWS継続的セキュリティ実践ガイド ログの収集/分析による監視体制の構築

    AWSマネージドサービスを活用した継続的セキュリティ監視体制を構築する

    この本で身につくこと
    • CloudTrail・VPC Flow Logs・WAFログ等、主要AWSサービスのログ出力先と取得方法を判断できる
    • GuardDuty・AWS Config・Macie・Inspectorの検知メカニズムとFindings形式(ASFF)を理解し、アラート対応フローを設計できる
    • ログをS3/CloudWatch Logsに集約し、Athenaやログ分析ツールで探索・可視化する監視ワークフローを構築できる
    • 不正アクセス・防御回避・データ窃取・DDoS攻撃の各シナリオでインシデント調査を進める手順を身につけられる

    想定読者: AWSを利用するシステム管理者・クラウドエンジニアで、CloudTrail/GuardDuty/AWS Config等のサービスをセキュリティ監視に組み込みたい人。セキュリティインシデント対応の手順を体系的に整理したいSRE・インフラ担当者にも適する。

    本の詳細を見る →
  5. オブザーバビリティ・エンジニアリング

    オブザーバビリティ・エンジニアリング
    この章の 1 冊 オブザーバビリティ・エンジニアリング

    分散システムの可観測性を背景・実践・組織導入まで体系化する

    この本で身につくこと
    • オブザーバビリティが従来のモニタリングと本質的に何が異なるかを言語化して説明できる
    • DevOps から SRE へのムーブメントの中でオブザーバビリティが不可欠とされた歴史的背景を理解する
    • Kubernetes などのクラウドネイティブ技術スタックやマイクロサービス設計において可観測性が必要とされる理由を説明できる
    • 可観測性の実践方法を個人・チーム・組織の各レイヤで段階的に導入するアプローチを把握する

    想定読者: DevOps/SRE の実践者、またはマイクロサービス・Kubernetes 環境でシステム障害時の内部状態把握に課題を感じているインフラ・バックエンドエンジニア

    前提知識: クラウドまたは Linux 環境でのサービス運用の実務経験(ログ確認・障害対応など) / Kubernetes またはコンテナベースのアーキテクチャの基礎知識 / DevOps・SRE の基本概念(SLO/SLA・インシデント管理・継続的デリバリ)の理解

    本の詳細を見る →
  6. 監視資本主義 : 人類の未来を賭けた闘い

    監視資本主義 : 人類の未来を賭けた闘い
    この章の 1 冊 監視資本主義 : 人類の未来を賭けた闘い

    行動データの商品化が民主主義と人間の自律性に及ぼす構造的脅威を解明する

    この本で身につくこと
    • 監視資本主義の定義と、検索・SNS企業が行動余剰(behavioral surplus)を産業原料として抽出・販売する仕組みを説明できる
    • 予測から行動変容への移行——データが人間の行動を予測するだけでなく修正・誘導する段階に至る論理的経緯を理解できる
    • ビッグ・アザー(Big Other)という概念を通じ、遍在する計測装置が個人の自律性を構造的に侵食するメカニズムを論じられる
    • テイラーの科学的管理法・フーコーの規律権力との比較を通じ、デジタル監視を歴史的文脈に位置づけられる

    想定読者: テクノロジー企業のビジネスモデルとデジタル社会の倫理・法制度設計に関心を持つ研究者・政策立案者・ビジネスパーソン。プラットフォーム企業のデータ利用の是非を自分の言葉で論じたい専門職全般

    本の詳細を見る →