第2章:情報収集(変更点/影響範囲/再現条件/証跡)

この章で学ぶこと

  • 直近変更点(デプロイ/設定/依存)を確認する
  • 影響範囲を特定し、優先順位を決める
  • 証跡(ログ/設定/メトリクス)を保全する

成果物(または判断基準)

本文

情報収集は“後から検証できる形”で行う。口頭で集めた情報は欠落しやすく、判断の根拠を追跡しにくい。

注: 証跡は上書き/ローテーションで失われる前に取得する。可能なら一次データ(raw)として保全する。

最低限の収集項目

  • 直近の変更(いつ/何を/誰が)
  • 影響範囲(利用者、機能、期間)
  • 再現条件(入力、負荷、時間帯)
  • 証跡(ログ、メトリクス、設定差分)

収集した情報は“状況共有テンプレ”に落とし込み、関係者が同じ前提で対応できるようにする。

初動チェックリスト例(最小)

  • 事象/影響を「インシデント記録」に書き出す(付録: インシデント記録
  • 「これはインシデントか?」を暫定判断する(付録: これはインシデントか?
  • 証跡を保全する(ログ/メトリクス/設定差分。対象期間を明確化)
  • 誤操作を防ぐ(追加デプロイや手動操作の前に、実施者/手順/観測指標を固定。必要に応じて変更凍結)
  • 連絡を開始する(付録: 状況共有。更新頻度と次回更新予定時刻を固定)

具体例(場当たり→再現性)

悪い例(場当たり)

変更点: たぶん何か変えた
影響範囲: 分かりません
証跡: 後で確認すればよい

良い例(再現性)

変更点: 10:05 に v1.2.3 をデプロイ(PR#123)
影響範囲: 決済 API のみ、10:12〜
再現: 特定の入力でタイムアウト
証跡: 期間のログ/メトリクス/設定を保存
共有: 状況共有テンプレで周知

チェックリスト

  • 直近変更点が特定できている
  • 影響範囲が説明できる
  • 証跡が保全されている
  • 状況共有が更新されている

まとめ

  • 直近変更点(デプロイ/設定/依存)を時系列で整理する
  • 影響範囲と優先順位を明確化し、状況共有に反映する
  • 証跡(ログ/メトリクス/設定差分)を保全し、後続調査に備える

次章への接続