第8章:コスト設計(premium requests / Actions minutes)
この章で扱うこと
- コスト構造の把握(premium requests / Actions minutes)
- “使いすぎない設計” を運用ルールに落とす(ガードレール/監視)
コスト構造(最小の分解)
エージェント運用のコストは、少なくとも次に分解して扱います。
- AI 推論コスト:モデル呼び出し(premium requests / API 利用など、提供者定義に依存)
- CI 実行コスト:GitHub Actions minutes、ストレージ、アーティファクト
用語や課金単位は変動し得るため、数値や定義は一次情報を参照し、リポジトリ側には 運用ルール を固定します。
“使いすぎない設計” の運用手順(例)
- 予算と上限を決める
- 月次/四半期、リポジトリ単位、チーム単位などで上限を定義
- 実行対象を絞る
- 重要 PR のみ、ラベル付きのみ、
workflow_dispatchのみ等に寄せる
- 重要 PR のみ、ラベル付きのみ、
- ガードレールを実装する
concurrencyによる多重実行抑止paths/if条件で不要な起動を避ける- モデル/
effortを用途別に分け、過剰品質を防ぐ
- 監視と例外対応を決める
- 利用状況を定期レビューし、上限超過時の対応(停止/縮退/承認)を明文化
- 棚卸し(改善)を回す
- 高頻度で失敗する自動化は、原因(仕様不足/テスト不足/対象過大)を潰してから再開する
章末チェックリスト(ドラフト)
- 予算/上限/監視の運用が定義されている
- コストの例外対応(緊急対応時の上限緩和等)が定義されている