インシデント対応 基礎:切り分け・状況共有・復旧・ポストモーテムの型
調査の型(仮説→検証→切り分け)と、インシデント運用(連絡/復旧判断/ポストモーテム)を最低限運用できる状態にする。
想定読者
- インシデント対応の一次受け、SRE、運用リード
- 障害時の切り分け・状況共有・復旧判断を標準化したい開発/運用担当
- ポストモーテムを改善サイクルにつなげたいテックリードや管理者
学習成果
- 症状と影響を分けて、初動の優先順位を決められる
- 証跡と影響範囲を最小限の粒度で整理し、関係者へ共有できる
- Severity、連絡、復旧、振り返りを一連の運用として扱える
初動フロー
読み方ガイド
- 初動対応は第1章→第2章→チェックリスト集の順で読み、症状の固定→情報収集→共有粒度の統一を先に行う
- まず目次を眺め、いま必要な成果物/判断がどこにあるかを特定する
- 付録のテンプレ/チェックリストを先に読み、本文で意図と落とし穴を補完する
- 章末のチェックリストをレビュー観点として運用に取り込む
前提知識
- システムの基本構成(Web/API/DB等)の理解
- ログ確認の基礎
目次
- 第1章: トラブルシューティングの基本フレーム(症状/影響/再現/仮説)
- 第2章: 情報収集(変更点/影響範囲/再現条件/証跡)
- 第3章: ログ・メトリクス・トレースの当たり方(最低限)
- 第4章: 切り分け戦略(範囲縮小/比較/安全な検証)
- 第5章: インシデント運用(Severity/役割/タイムライン)
- 第6章: 連絡とエスカレーション(判断基準/情報粒度)
- 第7章: 復旧とロールバック判断(暫定/恒久、リスク管理)
- 第8章: ポストモーテム(真因/再発防止/検知・手順改善)
付録
利用と更新情報
- ライセンス: CC BY-NC-SA 4.0(このライセンスでは商用利用は許諾されないため、商用利用は別途許諾が必要)
- 詳細なライセンス条件: LICENSE.md
- リポジトリ: https://github.com/itdojp/incident-response-basics-book
- 更新差分を追う場合は、コミット履歴 と PR 一覧 を参照する