インシデント対応 基礎:切り分け・状況共有・復旧・ポストモーテムの型
調査の型(仮説→検証→切り分け)と、インシデント運用(連絡/復旧判断/ポストモーテム)を最低限運用できる状態にする。
読み方ガイド
- まず目次を眺め、いま必要な成果物/判断がどこにあるかを特定する
- 付録のテンプレ/チェックリストを先に読み、本文で意図と落とし穴を補完する
- 章末のチェックリストをレビュー観点として運用に取り込む
前提知識
- システムの基本構成(Web/API/DB等)の理解
- ログ確認の基礎
目次
- 第1章: トラブルシューティングの基本フレーム(症状/影響/再現/仮説)
- 第2章: 情報収集(変更点/影響範囲/再現条件/証跡)
- 第3章: ログ・メトリクス・トレースの当たり方(最低限)
- 第4章: 切り分け戦略(範囲縮小/比較/安全な検証)
- 第5章: インシデント運用(Severity/役割/タイムライン)
- 第6章: 連絡とエスカレーション(判断基準/情報粒度)
- 第7章: 復旧とロールバック判断(暫定/恒久、リスク管理)
- 第8章: ポストモーテム(真因/再発防止/検知・手順改善)