第6章:手順書(実行前提/検証/ロールバック/リスク)

この章で学ぶこと

  • 手順書は「実行前提→実行→検証→失敗時→ロールバック」で構成する
  • 例外系とロールバック判断に必ず言及する
  • レビュー観点(不足すると問題化しやすい点)を持つ

この章の成果物(または判断基準)

本文

本章は、テンプレ→記入例→落とし穴→チェックリストの順で整理する。

テンプレ

記入例(要点)

  • 前提: production、承認者、停止可否
  • 実行: 具体的コマンド/設定
  • 検証: 成功条件(メトリクス/ログ)
  • 失敗時: 分岐(どこで止めるか)
  • ロールバック: 戻し方と判断基準

よくある落とし穴

  • 前提が曖昧で、権限不足で止まる
  • 検証が無く、成功/失敗が判断できない
  • ロールバック手順がない(戻せない)

具体例(悪い例→良い例)

悪い例

手順: 設定を変えてデプロイする
検証: 問題なければOK
ロールバック: そのとき考える

良い例

前提: production / 権限=deploy / メンテ枠=30分
手順: 1) 設定A 2) デプロイB 3) キャッシュC
検証: 5分間エラー率<1% かつ レイテンシ p95<200ms
失敗時: 直前のリリースへ切り戻し
ロールバック: 手順と判断基準(エラー率>5%)

チェックリスト

  • 前提(環境/権限/依存)が書かれている
  • 検証(成功条件)が数値で書かれている
  • 失敗時の分岐がある
  • ロールバック手順と判断基準がある
  • 責任分界(判断者/実行者)がある

まとめ

  • 手順書は前提→実行→検証→失敗時→ロールバックの順で構造化し、再現性を担保する
  • 検証とロールバック判断は数値/基準で定義し、責任分界と併せてレビューする

次章への接続