第8章:コスト設計(premium requests / Actions minutes)

この章で扱うこと

  • コスト構造の把握(premium requests / Actions minutes)
  • “使いすぎない設計” を運用ルールに落とす(ガードレール/監視)

コスト構造(最小の分解)

エージェント運用のコストは、少なくとも次に分解して扱います。

  • AI 推論コスト:モデル呼び出し(premium requests / API 利用など、提供者定義に依存)
  • CI 実行コスト:GitHub Actions minutes、ストレージ、アーティファクト

用語や課金単位は変動し得るため、数値や定義は一次情報を参照し、リポジトリ側には 運用ルール を固定します。

“使いすぎない設計” の運用手順(例)

  1. 予算と上限を決める
    • 月次/四半期、リポジトリ単位、チーム単位などで上限を定義
  2. 実行対象を絞る
    • 重要 PR のみ、ラベル付きのみ、workflow_dispatch のみ等に寄せる
  3. ガードレールを実装する
    • concurrency による多重実行抑止
    • paths / if 条件で不要な起動を避ける
    • モデル/effort を用途別に分け、過剰品質を防ぐ
  4. 監視と例外対応を決める
    • 利用状況を定期レビューし、上限超過時の対応(停止/縮退/承認)を明文化
  5. 棚卸し(改善)を回す
    • 高頻度で失敗する自動化は、原因(仕様不足/テスト不足/対象過大)を潰してから再開する

章末チェックリスト(ドラフト)

  • 予算/上限/監視の運用が定義されている
  • コストの例外対応(緊急対応時の上限緩和等)が定義されている