後付け

Source Notes

この後付けは、各章末の `Source Notes / Further Reading` を集約し、読者が「何を正本として信頼するか」と「次にどこを読めばよいか」を短く探し直せるようにするためのものである。本文の全注釈化や脚注の代替ではない。

この後付けは、各章末の Source Notes / Further Reading を集約し、読者が「何を正本として信頼するか」と「次にどこを読めばよいか」を短く探し直せるようにするためのものである。本文の全注釈化や脚注の代替ではない。

この後付けの役割

  • 本書の主張を支える source type を、repo artifact、公式 docs、長く残る engineering source に分けて示す
  • 章末では収まり切らない next step を、章単位でまとめて示す
  • glossary とは役割を分ける。glossary は用語定義、source notes は trust と再参照の導線を扱う

Source Policy

信頼する順番は固定する。

  1. repo 内の canonical artifact
  2. 使っている tool、platform、library の公式 docs
  3. 長く残る書籍、handbook、public design note
  4. ブログ、登壇資料、SNS

この順番を崩すと、本文の主張が流行語や一発成功例に引きずられやすい。特に AI agent 周辺は情報の更新が速いため、一般論より「いま自分が使っている tool の official behavior」を優先する。

章別 Source Notes

CH01 AIエージェントはどこで失敗するか

  • 最初に信頼するのは sample-repo/README.mdsample-repo/docs/domain-overview.mdsample-repo/docs/seed-issues.md である。failure mode の説明は recurring case と対応して初めて意味を持つ。
  • 外部 source を足すなら、利用中の coding agent、CI、issue tracker の公式 docs と、自分の現場の postmortem を優先する。agent のデモや単発成功例だけで failure model を作らない。

CH02 プロンプトを契約として設計する

  • 最初に信頼するのは prompts/bugfix-contract.mdprompts/feature-contract.mdchecklists/prompt-contract-review.md である。Prompt Contract は本文の比喩ではなく、repo に残る contract artifact として読む。
  • 外部 source を足すなら、利用中モデルの公式 prompting guide、structured output、tool use の docs を優先する。万能 prompt 集は source of truth にしない。

CH03 ChatGPTで要件と設計を固める

  • 最初に信頼するのは sample-repo/docs/product-specs/ticket-search.mdsample-repo/docs/design-docs/ticket-search-adr.mdsample-repo/docs/acceptance-criteria/ticket-search.md である。exploratory dialogue は、そのまま仕様の正本にならない。
  • 外部 source を足すなら、組織で使っている product spec、acceptance criteria、ADR のテンプレートと review record を優先する。要件定義はモデルの流暢さより意思決定の痕跡が重要である。

CH04 プロンプトを評価する

  • 最初に信頼するのは evals/prompt-contract-cases.jsonevals/rubrics/feature-spec.jsonscripts/run-prompt-evals.py である。prompt の良し悪しは雰囲気ではなく比較可能な case と rubric で読む。
  • 外部 source を足すなら、利用中モデルや eval framework の公式 docs を優先する。スクリーンショットだけの prompt comparison は回帰検知の source にならない。

CH05 Context Engineering の基礎

  • 最初に信頼するのは docs/context-model.mddocs/context-budget.mddocs/context-risk-register.md である。Context Engineering は情報量ではなく、寿命、更新責任、毒性の管理として読む。
  • 外部 source を足すなら、利用中ツールの context window、instruction layering、workspace access の公式 docs を優先する。長い prompt の寄せ集めは context design の説明にならない。

CH06 Repo Context を設計する

  • 最初に信頼するのは AGENTS.mdmanuscript/AGENTS.mdsample-repo/AGENTS.mdsample-repo/docs/repo-map.mdsample-repo/docs/architecture.mdsample-repo/docs/coding-standards.md である。repo-map は索引、architecture は設計理由として分けて読む。
  • 外部 source を足すなら、利用中 VCS、CI、package manager の公式 docs を優先する。repo の責務分離は一般論より実 repo の構成で判断する方が速い。

CH07 Task Context と Session Memory

  • 最初に信頼するのは sample-repo/tasks/FEATURE-001-brief.mdsample-repo/tasks/FEATURE-001-progress.mddocs/session-memory-policy.md.github/ISSUE_TEMPLATE/task.yml である。resume packet は最新 verify とセットで読む。
  • 外部 source を足すなら、issue tracker、handoff、change log の組織ルールを優先する。古い summary や chat log を session memory の正本にしない。

CH08 Skills と Context Pack を再利用する

  • 最初に信頼するのは .agents/skills/draft-chapter/SKILL.md.agents/skills/review-chapter/SKILL.mdsample-repo/.agents/skills/issue-to-plan/SKILL.mdsample-repo/.agents/skills/verification/SKILL.mdsample-repo/context-packs/ticket-search.md である。skill は再利用 workflow の契約、context pack は task ごとの最小入力として読む。
  • 外部 source を足すなら、利用中 agent runtime の公式 skill / instruction docs を優先する。フレームワーク名だけで再利用設計を説明しない。

CH09 Harness Engineering の基礎

  • 最初に信頼するのは scripts/init.shscripts/verify-sample.shsample-repo/docs/harness/single-agent-runbook.mdsample-repo/docs/harness/permission-policy.mdsample-repo/docs/harness/done-criteria.md である。single-agent harness は prompt の言い換えではなく、開始条件と終了条件の束である。
  • 外部 source を足すなら、shell、CI runner、permission model の公式 docs を優先する。権限境界は agent の印象論ではなく、実行環境の仕様で決める。

CH10 Verification Harness を作る

  • 最初に信頼するのは .github/workflows/verify.ymlchecklists/verification.mdsample-repo/tests/test_ticket_search.pyartifacts/evidence/README.md である。verification harness は test、CI、evidence、approval の流れで読む。
  • 外部 source を足すなら、利用中 test framework、CI、coverage tool の公式 docs を優先する。green screenshot だけでは reviewer が再検証できない。

CH11 Long-running Task と Multi-agent

  • 最初に信頼するのは sample-repo/docs/harness/feature-list.mdsample-repo/docs/harness/restart-protocol.mdsample-repo/docs/harness/multi-agent-playbook.mdsample-repo/tasks/FEATURE-002-plan.md である。multi-agent は role split と restart packet(canonical inputs)が揃って初めて扱う。
  • 外部 source を足すなら、使っている orchestration tool や task queue の公式 docs を優先する。並列化の議論を、write scope と handoff artifact から切り離さない。

CH12 運用モデルと組織導入

  • 最初に信頼するのは docs/operating-model.mddocs/metrics.mdchecklists/repo-hygiene.md.github/pull_request_template.md である。運用モデルは Lead / Operator / Reviewer、approval boundary、review budget、cadence、cleanup の組で読む。
  • 外部 source を足すなら、組織が採用する review policy、release policy、metrics definition の公式文書を優先する。導入判断をモデル比較だけで閉じない。