付録J: 実在アクセッション一覧(最終確認日付き)

目的

本文では、再現に使う題材を 2 系列に絞ります。 本付録は、章横断で参照するアクセッション / プロジェクト ID、想定章、注意点をまとめた入口です。

本書で使う共通題材

  • 題材A: SARS-CoV-2 公開データ
    • 最小の QC / マッピング / 変異検出と、監視系設計の例に使う
  • 題材B: TCGA-LUAD 研究用ミニケース
    • 発現行列・変異情報・臨床メタデータを統合し、研究支援から臨床連携へ渡す境界を確認する

最終確認日

  • 2026-03-09
  • 確認日以降に削除・移動・アクセス制限の変更が起きる可能性があります。

実在アクセッション / プロジェクト ID 一覧

題材 データベース アクセッション / プロジェクト ID 想定章 主な入力 / 成果物 最終確認日 注意点
SARS-CoV-2 変異追跡 SRA SRR11140744 第4章 / 第10章 / 第14章 FASTQ → BAM / VCF / QC レポート 2026-03-09 小規模公開データとして最小パイプラインの確認に使う
SARS-CoV-2 参照配列 GenBank / RefSeq MN908947.3 第4章 / 第14章 参照 FASTA 2026-03-09 参照配列 ID をログへ必ず残す
研究用がんコホート GDC / TCGA TCGA-LUAD 第7章 / 第10章 / 第12章 / 第14章 発現行列、変異情報、臨床メタデータ 2026-03-09 研究用途の公開データ。診断・治療判断には直接用いない

章ごとの使い分け

題材 見るべきポイント 出力の例
第4章 SRR11140744 + MN908947.3 QC、マッピング、変異検出、ログの残し方 BAM、VCF、QC レポート
第7章 TCGA-LUAD 特徴量設計、データ分割、評価指標、リーク回避 比較表、評価指標、用途制約メモ
第10章 SRR11140744 / TCGA-LUAD スキーマ、索引、由来情報、権限制御 テーブル設計、クエリ計測結果
第12章 TCGA-LUAD 研究用途と臨床用途の境界、レポート候補、監査可能性 所見サマリ、責任分界メモ
第14章 両題材 ケース比較、目的と制約の切り分け ケース比較表、導入判断メモ

運用ルール

  • 参照不可になった場合は、同じ用途を満たす公開データへ差し替え、確認日と差し替え理由を更新します。
  • 実データを扱う際は、サンプル ID、参照配列 ID、ツール版、実行日を一緒に記録します。
  • TCGA-LUAD は研究用途の retrospective review として扱い、診療判断の根拠としては用いません。

← 付録I へ 目次に戻る 次へ: 付録K →