2026年版出典監査メモ

編集用リソース: このページは Issue #251 の出典確認状況を管理するための監査メモです。本文へ正式反映する前の確認状態を含むため、読者向けの確定解説としては扱いません。

このメモは、Issue #251 の全面改稿で本文に反映する出典、確認日、本文反映先を管理するための初期棚卸しです。ここにある情報は本文へ反映する前に、該当章で文脈、利用条件、制限を再確認します。

確認済み事項(確認日: 2026-04-27)

領域 確認した事項 主な反映先 出典
ヒトパンゲノム HPRC Data Release 2 を初期棚卸し対象として採用した。Release の人数・アセンブリ数は pangenome / reference bias 行、Data Use は HPRC data use 行、章別の本文反映責務は pangenome / population genomics 行で管理する。 第1章, 第3章, 第4章, 第9章, 第14章 HPRC Data Release 2
AlphaFold DB AlphaFold DB v6 は UniProt 2025_03 と同期し、26 million 超の新規予測構造を追加、合計 241,070,489 predicted protein structures と説明されている。 第7章, 第14章, 付録H PDBe AlphaFold Database release notes
Ensembl 2026-02-12時点の公式案内では、Ensembl 116 / Ensembl Genomes 63 は 2026年4月予定で、現行 Ensembl site and platforms の final releases となる見込みと説明されている。実際のリリース済み状況は別途確認する。 第10章, 付録I, 付録H Ensembl Blog: release 116 / Genomes 63

確認済み事項(確認日: 2026-04-28)

領域 確認した事項 主な反映先 出典
GRCh38 GRC FAQ は現行 human reference genome assembly の公式名称を Genome Reference Consortium Human Build 38、略称を GRCh38 と説明している。GRC Human Overview は GRCh38.p14 を latest minor release として示し、GRCh39 の coordinate-changing update は延期中と説明している。 第1章, 第3章, 第4章, 第9章, 第14章 GRC FAQ, GRC Human Overview
T2T-CHM13 NCBI Insights は 2022-04-01 に Science が T2T-CHM13 を first complete sequence of a human genome として発表したこと、NCBI が T2T-CHM13 と GRCh38.p14 間の remap を案内していることを説明している。NCBI Datasets では T2T-CHM13v2.0 を GCA_009914755.4 として確認した。 第1章, 第3章, 第4章, 第14章 NCBI Insights: T2T-CHM13 now available, NCBI Datasets: T2T-CHM13v2.0
pangenome / reference bias HPRC は GRCh38 linear reference が reference bias を生み、downstream variant discovery、disease association studies、reference-based mapping の精度に影響し得ると説明している。HPRC Data Release 2 は 2025-05-12 発表の pre-publication release で、200人超の配列データと 232 individuals 由来のアセンブリを含むと説明されている。 第1章, 第3章, 第4章, 第9章, 第14章 HPRC, HPRC Data Release 2, HPRC Data Use: Best Practices
HPRC data use HPRC Data Use は Release II の構成要素として >230 samples の DNA sequence data、対応する phased/near-Telomere-to-Telomere assemblies、annotations、graph-based assembly alignments を挙げ、利用時の best practices を説明している。 第1章, 第11章, 第14章 HPRC Data Use: Best Practices
JSBi認定試験 2026年度試験は CBT 方式、120分、4者択一式、60問と案内されている。第1回受験期間は 2026-07-11〜2026-08-09 予定、第2回は 2026-11-07〜2026-12-06 予定。受験資格は問わず、受験料は6,000円(税込)。出題範囲は生命科学分野、情報科学分野、バイオインフォマティクス分野として整理されている。JSBi は『バイオインフォマティクス入門』を参考図書に掲載し、出版事業ページで公式教科書として案内している。 第0章, 付録G JSBi 2026年度認定試験情報, JSBi 出題範囲, JSBi 参考図書, JSBi 出版事業

確認済み事項(確認日: 2026-05-12)

領域 確認した事項 主な反映先 出典
AI / foundation model AlphaGenome は Google DeepMind の DNA sequence-to-function モデルで、1 Mb の DNA 配列入力、単一塩基分解能の予測、variant effect prediction を扱う。API は非商用利用条件のもと研究用途で提供され、直接の臨床目的には設計・検証されていないと説明されている。 第7章, 第14章, 付録F, 付録H Google DeepMind: AlphaGenome, Nature: AlphaGenome, AlphaGenome research repository, AlphaGenome API repository
AI / foundation model Evo 2 は Arc Institute / NVIDIA / Stanford などによる DNA foundation model で、Nature 2026 論文と公式 repository で、長文脈ゲノム配列の予測・設計支援、公開コード・モデル・データ、計算資源要件が説明されている。生成配列の機能性や安全性は実験的検証の対象として扱う。 第7章, 第14章, 付録F, 付録H Arc Institute: Evo 2, Evo 2 repository, Nature: Evo 2

確認済み事項(確認日: 2026-05-13 JST)

この節の各行は、個別に明記がない限り 2026-05-13 JST に確認した事項として扱う。

領域 確認した事項 主な反映先 出典
AI / structure prediction AlphaFold 3 はタンパク質、核酸、小分子、イオン、修飾残基を含む複合体の joint structure prediction を扱う。AlphaFold Server は非商用利用で、ローカル推論パイプラインのモデルパラメータは Google から直接受領したものに限り、利用条件に従う必要がある。出力は理論モデリング用で、臨床用途には使わない。 第7章, 第14章, 付録H Nature: AlphaFold 3, AlphaFold 3 repository, AlphaFold 3 model parameter terms
AlphaFold DB / API AlphaFold DB v6 は UniProt 2025_03 と同期し、Web版は最新モデルのみを提供、旧版はFTPで提供される。prediction API は旧fieldと新fieldのdual support期間中で、旧fieldは2026-06-25 sunset予定と説明されている。 第7章, 第10章, 第14章, 付録H, 付録I PDBe AlphaFold Database release notes, PDBe AFDB API breaking changes
AI / variant effect prediction AlphaMissense は human missense variant の pathogenicity prediction と優先順位づけを支援する。公式 repository は参照実装として提供され、学習済み重みは提供されない。AlphaMissense Database の予測はconfidenceが異なり、臨床用途には検証・承認されていないと説明されている。 第7章, 第12章, 第14章, 付録H Google DeepMind: AlphaMissense publication, AlphaMissense repository
AI / foundation model Nucleotide Transformer は DNA sequence で事前学習した foundation model 群で、Nature Methods 論文では 50M〜2.5B parameters、3,202 human genomes、850 diverse species genomes を用いたモデル群として説明されている。公式 repository は inference code とpre-trained weightsを公開し、モデル別documentation参照を案内している。 第7章, 第14章, 付録H Nature Methods: Nucleotide Transformer, Nucleotide Transformer repository
AI / single-cell foundation model scGPT は single-cell multi-omics の foundation model で、cell type annotation、multi-batch integration、multi-omic integration、perturbation response prediction、gene network inference の支援が説明されている。公式 repository はwhole-human checkpointを既定推奨とし、33 million normal human cellsで事前学習したと説明している。 第7章, 第8章, 第14章, 付録H Nature Methods: scGPT, scGPT repository
single-cell / Scanpy Scanpy 1.12.1 は 2026-04-10 に PyPI へ公開され、scverse は Scanpy を preprocessing、visualization、clustering、trajectory inference、differential expression を含む scalable toolkit と説明している。scanpy.pp.calculate_qc_metrics は総カウント、検出遺伝子数、QC変数(例: mitochondrial genes)割合などを算出する。 第8章, 付録H Scanpy PyPI, scverse packages: Scanpy, Scanpy calculate_qc_metrics
single-cell / Seurat v5 Seurat 公式サイトは Seurat v5 の導入、PBMC 3k tutorial、Visium HD spatial dataset 解析の導線を提供している。PBMC tutorial の nFeature_RNA > 200nFeature_RNA < 2500percent.mt < 5 はPBMC例の設定として扱い、他データへ一般化しない。R/Seurat と Python/Scanpy の結果は既定値・データ構造・versionに依存するため、本文では実装・version・入力オブジェクトを記録する。 第8章, 付録H Getting Started with Seurat v5, Seurat PBMC 3K tutorial, Seurat Visium HD vignette
single-cell / spatial data model AnnData は annotated data matrix、MuData は annotated multimodal datasets、SpatialData は spatial omics datasets のFAIR storage formatとPython librariesとして説明されている。SpatialDataはactive developmentでAPI変更の可能性があるため、利用versionの記録が必要。 第8章, 第14章, 付録H AnnData documentation, MuData documentation, SpatialData documentation, Nature Methods: SpatialData
spatial / Visium HD 10x Genomics は Visium HD WT Panel と HD 3’ Gene Expression を single-cell-scale の spatial assay として説明し、HD 3’ は whole transcriptome coverage、2 µm x 2 µm barcoded squares を示している。本文では bin/spot/segmentation/cell label を区別し、画像位置合わせ、Space Ranger version、サンプル条件を記録する。 第8章, 第14章, 付録H 10x Genomics Visium product family, 10x Genomics HD 3’ Gene Expression, 10x Genomics Visium HD user guides
single-cell QC scRNA-seq QCでは、固定閾値だけでなくデータ分布・組織・細胞型・サンプル品質を踏まえた adaptive / data-driven QC が必要と報告されている。本文の max_mito_fractionmax_genes は概念例の入力パラメータであり、固定推奨値として扱わない。 第8章 Genome Biology: data-driven QC, PLOS Computational Biology: miQC
privacy / 個人情報保護 個人情報保護委員会の通則ガイドラインは、個人情報、要配慮個人情報、個人識別符号、仮名加工情報、匿名加工情報などの用語を区別し、個人データの取扱いではアクセス制御、識別・認証、不正アクセス防止、漏えい防止などの安全管理措置を確認する必要がある。医療・介護Q&Aでは、条件を満たすゲノムデータが個人識別符号に該当し得る例示がある。 第11章, 第12章 PPC: 個人情報保護法ガイドライン(通則編), PPC: 医療・介護関係事業者Q&A, PPC: 仮名加工情報・匿名加工情報編
research ethics / 人を対象とする研究 人を対象とする生命科学・医学系研究では、研究計画、同意、倫理審査、個人情報の扱いを研究手順と分けずに管理する。MEXTページでは、旧ヒトゲノム・遺伝子解析研究指針と旧医学系研究指針が統合後の指針施行に伴い 2021-06-30 に廃止されたこと、令和5年改正本文と令和6年4月1日一部改訂ガイダンスが掲載されている。 第11章, 第12章, 第13章 文部科学省: 人を対象とする生命科学・医学系研究
human data sharing / NBDC NBDCヒトデータベースは、公的資金由来のヒトに関するデータを広く収集・共有し、研究対象者の権利を可能な限り尊重する原則で運用される。データ提供では同意文書・倫理審査・利用制限、非制限公開/登録者公開/制限公開等の区分、制限公開データの Type I / Type II セキュリティレベル、利用者側IT環境の追加対策を確認する。 第11章, 第13章, 付録J NBDCヒトデータ共有ガイドライン, NBDCヒトデータ取扱いセキュリティガイドライン(データ利用者向け)
medical data / 次世代医療基盤法 改正次世代医療基盤法は 2023-05-26 公布、2024-04-01 施行と案内され、匿名加工医療情報に加えて仮名加工医療情報の作成・提供、匿名加工医療情報と医療・介護に関する公的データベースとの連結が説明されている。通常の研究解析、院内利用、NBDC利用、個人情報保護法上の仮名加工情報とは適用枠組みを混同しない。 第11章, 第12章 内閣府: 次世代医療基盤法に基づく事業者の認定, 内閣府: 1人のデータ、みんなの健康、次世代法
clinical genomics / germline・somatic ClinVar はヒトの variation と phenotype の関係に関する提出情報と supporting evidence へのアクセスを提供する public archive で、提出内容を独自に curate / modify しない。ClinGen の variant classification guidance は ACMG/AMP criteria を VCEP specifications 等で具体化し、somatic oncogenicity と clinical actionability は pathogenicity classification と分けて扱う。 第12章 NCBI ClinVar: What is ClinVar?, ClinGen Variant Classification Guidance, ClinGen somatic oncogenicity recommendations, ClinGen Actionability
clinical genomics / cancer knowledgebase CIViC は cancer variant の clinical interpretation を共有する open-access, open-source, community-driven knowledgebase と説明されている。OncoKB の FDA recognized human genetic variant database としての扱いは、FDA が認識する Level 2 / Level 3 biomarkers の範囲に限定して扱い、OncoKB / CIViC の evidence level をDB横断で機械的に換算しない。 第12章, 第14章 CIViC documentation: About CIViC, OncoKB: FDA Recognition, OncoKB Therapeutic Levels of Evidence, FDA Recognition of Public Human Genetic Variant Databases
clinical genomics / pharmacogenomics CPIC guidelines は、利用可能な遺伝子検査結果を薬物療法にどう使うかを示すためのもので、遺伝子検査を実施すべきかを決めるものとして扱わない。ClinPGx は PharmGKB の移行先として案内され、PharmCAT では CPIC/FDA 等のrecommendation matching、source guideline、tool version、入力VCF要件を確認する。 第12章 CPIC Guidelines, ClinPGx, ClinPGx Blog: Announcing ClinPGx, PharmCAT Matching Recommendations, FDA Table of Pharmacogenetic Associations
clinical genomics / biomarker・CDx TMB、MSI、HRD、companion diagnostics は、検査法、閾値、腫瘍種、適応、薬剤ラベル、PMA等の識別子と切り離して一般化しない。FDA/NCIの定義・承認情報・companion diagnostics一覧は更新され得るため、研究・教育用サマリでは確認日、検査名、対象疾患、出典を併記する。 第12章, 第14章 NCI: tumor mutational burden, FDA: TMB-H pembrolizumab approval, NCI: MSI, FDA: first tissue/site agnostic indication, FDA: HRD-positive niraparib approval, FDA PMA P190014: myChoice HRD CDx, FDA Companion Diagnostics, FDA List of Cleared or Approved Companion Diagnostic Devices
pangenome / population genomics 2026-04-28 の pangenome / reference bias 行を本文へ反映する際の章別責務を整理する。第3章では graph reference と索引構造の関係、第4章では reference_versionaccessionchecksum、DB release、解析日の記録、第9章では GWAS/PRS の前提として reference buildliftover/remapvariant representationchecksum、解析バージョンを記録する。第14章ではケーススタディで参照選択、reference build、来歴、利用条件の記録方針を扱う。Release の人数・アセンブリ数・reference bias の一次確認は pangenome / reference bias 行を正とし、この行では重複再掲しない。 第3章, 第4章, 第9章, 第14章 HPRC, HPRC Data Release 2, HPRC Data Use: Best Practices
GWAS / PRS metadata NHGRI-EBI GWAS Catalog は published GWAS results と sample metadata を整理し、PGS Catalog は scoring files、publication source、development/evaluation samples、performance metrics、ancestry description を提供する。sample ancestry は自己申告属性や race/ethnicity の単純な代替ラベルとしてではなく、収集・解析上のメタデータとして扱う。PRS/PGS は discovery cohort と target cohort の ancestry、LD構造、phenotype definition、imputation panel、allele alignment、外部検証に依存するため、研究・教育用サマリでは performance と適用外条件を併記する。 第9章, 第12章, 第14章 GWAS Catalog documentation, PGS Catalog downloads, PGS Catalog ancestry description, Nature Genetics: PRS health disparities

早期に確認する事項

優先度 領域 確認対象 主な反映先 確認方針
ライセンス 現行サイトとリポジトリの CC BY-NC-SA 4.0 表記、商用利用は別契約であること 第0章, ライセンスページ ローカル LICENSE, LICENSE.md, 公開サイトを照合する
コード分類 実行検証済み概念例疑似コード抜粋環境依存 の全章適用状況 全章, 付録A, 付録E scripts/check_codeblock_tags.py と章本文を照合する
single-cell / spatial Seurat v5、Scanpy、scverse、SpatialData、Visium HD / HD 3’、QC閾値の新規リリース・本文反映状況 第8章, 付録H 確認済み行を基準に、公式ドキュメント・論文・製品ページを継続確認する
日本の個人情報・研究倫理 個人識別符号、要配慮個人情報、NBDCヒトデータベース、次世代医療基盤法の新規改正・本文反映状況 第11章, 第12章 確認済み行を基準に、PPC、NBDC、文部科学省、厚生労働省、内閣府等の一次情報を継続確認する
臨床ゲノム ACMG/AMP、AMP/ASCO/CAP、ClinGen、ClinVar、CIViC、OncoKB、CPIC、ClinPGx、PharmCAT、TMB/MSI/HRD/CDx の新規改訂・本文反映状況 第12章, 第14章 確認済み行を基準に、公式ガイドライン、DB公式ページ、FDA/NCI等の一次情報を継続確認する
pangenome / GWAS / PRS HPRC、GRCh38/T2T/pangenome、GWAS Catalog、PGS Catalog、PRS transferability、ancestry metadata の新規改訂・本文反映状況 第3章, 第4章, 第9章, 第14章 確認済み行を基準に、公式ページ、カタログdocumentation、一次論文を継続確認する
AI / foundation model AlphaFold 3、AlphaFold Server、AlphaFold DB、AlphaGenome、Evo 2、Nucleotide Transformer、scGPT、AlphaMissense の新規リリース・利用条件・本文反映状況 第7章, 第14章, 付録F, 付録H 確認済み行を基準に、公式ページ、論文、利用規約を継続確認する
ワークフロー Nextflow、Snakemake、nf-core、GATK Best Practices、MultiQC、Docker、Apptainer、Bioconda、uv 第2章, 第4章, 第5章, 付録A, 付録E 公式ドキュメントでバージョン、利用条件、実行例を確認する
DB/API NCBI Datasets CLI、Entrez / E-utilities、Ensembl REST / BioMart、UniProt API、GENCODE、RefSeq、GA4GH refget / htsget / Beacon 第10章, 付録I, 付録H API仕様、rate limit、ライセンス、取得例を確認する
アクセッション SRR11140744, MN908947.3, TCGA-LUAD の取得可否、参照配列、利用条件 第4章, 第5章, 第10章, 第14章, 付録J SRA、NCBI Nucleotide、GDC等で確認する

初期構成監査(ローカル確認日: 2026-04-27)

項目 現状 改稿上の扱い
公開サイトソース docs/ が Jekyll build の主対象。GitHub Actions も docs を検査対象にしている。root _data/navigation.yml は公開正本ではないが、将来の再利用時に旧 part1/part2 導線を戻さないよう docs/_data/navigation.yml と同期済み。docs/root/template 側の breadcrumb・navigation・fallback・footer・index も、旧 /introduction/ ではなく canonical /chapters/chapter-introduction/ を参照する。 章改稿は docs/ を優先し、必要に応じて manuscript/ と同期する。ナビゲーション編集時は docs/_data/navigation.yml を正本とし、root 側テンプレートは追随させる。
章構成 docs/chapters/chapter-introduction と第1章〜第14章が存在する。 Issue #251 の章テンプレートを段階適用する。
付録構成 付録A〜Kと付録I-1〜I-5が存在する。 付録Iはレシピ集化、ExACの歴史的位置づけ、API運用説明を優先する。
コードブロック docs/ の fenced code block は既存スクリプトで全件ラベル付き。manuscript/ には未ラベルの code block が多数残る。 docs/ の新ラベル移行後、manuscript/ の同期方針を決める。
表記ゆれ docs/appendices/appendix-i/index.md に残っていた非推奨表記は解消済み。現行の docs/manuscript/ では「ベストプラクティス」表記を使う。 今後の追記でも「ベストプラクティス」に統一し、旧表記を再導入しない。
single-cell QC 第8章の概念例に固定除外値が残っていた。 データセット依存の閾値として説明し、固定値の機械的流用を避ける。
余剰ページ docs/chapters/part2/chapter05/index.md は、公開ナビゲーションに含まれない旧構成由来の第5章重複ページだったため削除済み。現行の正本は docs/chapters/chapter-5/index.mdmanuscript/chapter-5/index.md 以後の第5章改稿は canonical な docs/chapters/chapter-5/manuscript/chapter-5/ に集約し、docs/chapters/part2/ 配下の旧導線を再導入しない。

本文反映時の記録単位

各章を改稿したら、次の形式で本メモへ追記します。

章・付録 反映した更新 出典 確認日 残課題
例: 第8章 QC閾値を固定値からデータセット依存の説明へ変更 公式ドキュメントまたは論文 YYYY-MM-DD 実行例の tiny data 化
第2章 HPC/クラウド/コンテナ/ワークフロー/CI を章テンプレートへ再構成し、SHIROKANE 等の固定性能値を本文から外して、公式情報・ジョブログ・確認日を利用時に記録する方針へ変更した。 docs/appendices/appendix-a/, docs/appendices/appendix-e/, workflow 行 2026-05-12 実行検証済み tiny data smoke は CI と付録A/Eに集約。第4章・第5章の具体pipeline説明で継続参照する。