インシデント対応 基礎:切り分け・状況共有・復旧・ポストモーテムの型

インシデント対応 基礎:切り分け・状況共有・復旧・ポストモーテムの型

トラブルシューティングからインシデント運用、連絡/復旧判断、ポストモーテムまでの基本フレームを扱う。

目次

  • はじめに

本編

  • 第1章:トラブルシューティングの基本フレーム(症状/影響/再現/仮説)
  • 第2章:情報収集(変更点/影響範囲/再現条件/証跡)
  • 第3章:ログ・メトリクス・トレースの当たり方(最低限)
  • 第4章:切り分け戦略(範囲縮小/比較/安全な検証)
  • 第5章:インシデント運用(Severity/役割/タイムライン)
  • 第6章:連絡とエスカレーション(判断基準/情報粒度)
  • 第7章:復旧とロールバック判断(暫定/恒久、リスク管理)
  • 第8章:ポストモーテム(真因/再発防止/検知・手順改善)

付録

  • テンプレ集
  • チェックリスト集
  • 参考文献
GitHub

テンプレ集

インシデント時の記録/共有のテンプレ集です。

目次

  • インシデント記録
  • タイムライン
  • 状況共有
  • これはインシデントか?(最小判断フロー)
  • エスカレーション
  • ポストモーテム
← 前へ 第8章:ポストモーテム(真因/再発防止/検知・手順改善) 目次へ 次へ チェックリスト集 →
Edit this page on GitHub
CC BY-NC-SA 4.0
GitHub