インシデント対応 基礎:切り分け・状況共有・復旧・ポストモーテムの型

調査の型(仮説→検証→切り分け)と、インシデント運用(連絡/復旧判断/ポストモーテム)を最低限運用できる状態にする。

想定読者

  • インシデント対応の一次受け、SRE、運用リード
  • 障害時の切り分け・状況共有・復旧判断を標準化したい開発/運用担当
  • ポストモーテムを改善サイクルにつなげたいテックリードや管理者

学習成果

  • 症状と影響を分けて、初動の優先順位を決められる
  • 証跡と影響範囲を最小限の粒度で整理し、関係者へ共有できる
  • Severity、連絡、復旧、振り返りを一連の運用として扱える

初動フロー

  • まず第1章で症状/影響/再現/仮説の切り分けを確認する
  • 続けて第2章とチェックリスト集で情報収集の粒度をそろえる
  • 迷ったらテンプレ集を使い、状況共有の書式を固定する

読み方ガイド

  • 初動対応は第1章→第2章→チェックリスト集の順で読み、症状の固定→情報収集→共有粒度の統一を先に行う
  • まず目次を眺め、いま必要な成果物/判断がどこにあるかを特定する
  • 付録のテンプレ/チェックリストを先に読み、本文で意図と落とし穴を補完する
  • 章末のチェックリストをレビュー観点として運用に取り込む

前提知識

  • システムの基本構成(Web/API/DB等)の理解
  • ログ確認の基礎

目次

付録

利用と更新情報