第2章:情報収集(変更点/影響範囲/再現条件/証跡)
この章で学ぶこと
- 直近変更点(デプロイ/設定/依存)を確認する
- 影響範囲を特定し、優先順位を決める
- 証跡(ログ/設定/メトリクス)を保全する
成果物(または判断基準)
本文
情報収集は“後から検証できる形”で行う。口頭で集めた情報は欠落しやすく、判断の根拠を追跡しにくい。
注: 証跡は上書き/ローテーションで失われる前に取得する。可能なら一次データ(raw)として保全する。
最低限の収集項目
- 直近の変更(いつ/何を/誰が)
- 影響範囲(利用者、機能、期間)
- 再現条件(入力、負荷、時間帯)
- 証跡(ログ、メトリクス、設定差分)
収集した情報は“状況共有テンプレ”に落とし込み、関係者が同じ前提で対応できるようにする。
初動チェックリスト例(最小)
- 事象/影響を「インシデント記録」に書き出す(付録: インシデント記録)
- 「これはインシデントか?」を暫定判断する(付録: これはインシデントか?)
- 証跡を保全する(ログ/メトリクス/設定差分。対象期間を明確化)
- 誤操作を防ぐ(追加デプロイや手動操作の前に、実施者/手順/観測指標を固定。必要に応じて変更凍結)
- 連絡を開始する(付録: 状況共有。更新頻度と次回更新予定時刻を固定)
具体例(場当たり→再現性)
悪い例(場当たり)
変更点: たぶん何か変えた
影響範囲: 分かりません
証跡: 後で確認すればよい
良い例(再現性)
変更点: 10:05 に v1.2.3 をデプロイ(PR#123)
影響範囲: 決済 API のみ、10:12〜
再現: 特定の入力でタイムアウト
証跡: 期間のログ/メトリクス/設定を保存
共有: 状況共有テンプレで周知
チェックリスト
- 直近変更点が特定できている
- 影響範囲が説明できる
- 証跡が保全されている
- 状況共有が更新されている
まとめ
- 直近変更点(デプロイ/設定/依存)を時系列で整理する
- 影響範囲と優先順位を明確化し、状況共有に反映する
- 証跡(ログ/メトリクス/設定差分)を保全し、後続調査に備える
次章への接続
- 次章: 第3章