付録J: 実在アクセッション一覧(最終確認日付き)
目的
本文では、再現に使う題材を 2 系列に絞ります。
本付録は、章横断で参照するアクセッション / プロジェクト ID、想定章、注意点をまとめた入口です。
本書で使う共通題材
- 題材A: SARS-CoV-2 公開データ
- 最小の QC / マッピング / 変異検出と、監視系設計の例に使う
- 題材B: TCGA-LUAD 研究用ミニケース
- 発現行列・変異情報・臨床メタデータを統合し、研究支援から臨床連携へ渡す境界を確認する
最終確認日
- 2026-03-09
- 確認日以降に削除・移動・アクセス制限の変更が起きる可能性があります。
実在アクセッション / プロジェクト ID 一覧
| 題材 |
データベース |
アクセッション / プロジェクト ID |
想定章 |
主な入力 / 成果物 |
最終確認日 |
注意点 |
| SARS-CoV-2 変異追跡 |
SRA |
SRR11140744 |
第4章 / 第10章 / 第14章 |
FASTQ → BAM / VCF / QC レポート |
2026-03-09 |
小規模公開データとして最小パイプラインの確認に使う |
| SARS-CoV-2 参照配列 |
GenBank / RefSeq |
MN908947.3 |
第4章 / 第14章 |
参照 FASTA |
2026-03-09 |
参照配列 ID をログへ必ず残す |
| 研究用がんコホート |
GDC / TCGA |
TCGA-LUAD |
第7章 / 第10章 / 第12章 / 第14章 |
発現行列、変異情報、臨床メタデータ |
2026-03-09 |
研究用途の公開データ。診断・治療判断には直接用いない |
章ごとの使い分け
| 章 |
題材 |
見るべきポイント |
出力の例 |
| 第4章 |
SRR11140744 + MN908947.3 |
QC、マッピング、変異検出、ログの残し方 |
BAM、VCF、QC レポート |
| 第7章 |
TCGA-LUAD |
特徴量設計、データ分割、評価指標、リーク回避 |
比較表、評価指標、用途制約メモ |
| 第10章 |
SRR11140744 / TCGA-LUAD |
スキーマ、索引、由来情報、権限制御 |
テーブル設計、クエリ計測結果 |
| 第12章 |
TCGA-LUAD |
研究用途と臨床用途の境界、レポート候補、監査可能性 |
所見サマリ、責任分界メモ |
| 第14章 |
両題材 |
ケース比較、目的と制約の切り分け |
ケース比較表、導入判断メモ |
運用ルール
- 参照不可になった場合は、同じ用途を満たす公開データへ差し替え、確認日と差し替え理由を更新します。
- 実データを扱う際は、サンプル ID、参照配列 ID、ツール版、実行日を一緒に記録します。
TCGA-LUAD は研究用途の retrospective review として扱い、診療判断の根拠としては用いません。