付録F: 参考資料

更新日・選定基準

最終更新日: 2026-01-24
選定基準:
- 本文で参照する概念・手法に直接関係する
- 初学者が一次情報に到達できる
- 実務での利用頻度が高い

2024–2025の主要トピック（追加分）

AlphaFold 3 / AlphaFold Server
AlphaFold DB 2025
scGPT
Nicheformer
Nucleotide Transformer
AlphaMissense
T2T-CHM13（完全ヒトゲノム）
ヒト・パンゲノム参照
DeepVariant

必読書籍

基礎理論

“Bioinformatics Algorithms” - Compeau & Pevzner
- アルゴリズム理論と実装の標準的テキスト
“Introduction to Computational Biology” - Waterman
- 数学的基礎から応用まで網羅
“Pattern Recognition and Machine Learning” - Bishop
- 機械学習の理論的基盤

実装・応用

“Programming for Bioinformatics” - Allison
- 実装技術の詳細ガイド
“Computational Molecular Biology” - Pevzner
- アルゴリズム設計の実践的手法
“Systems Biology” - Klipp et al.
- システム生物学の数理モデル

主要学術ジャーナル

計算生物学専門誌

Bioinformatics (Oxford Academic): IF 5.8
PLoS Computational Biology: オープンアクセス
BMC Bioinformatics: 手法論重視
Journal of Computational Biology: 理論・応用バランス

応用・学際誌

Nature Methods: 手法開発のトップジャーナル
Genome Research: ゲノム解析技術
Cell Systems: システム生物学
Science Translational Medicine: 臨床応用

主要データベース・リソース

配列データベース

NCBI GenBank: https://www.ncbi.nlm.nih.gov/genbank/
- 最大級の公共配列データベース
UniProt: https://www.uniprot.org/
- タンパク質配列・機能情報
PDB: https://www.rcsb.org/
- 3次元構造データベース

ゲノムブラウザ

UCSC Genome Browser: https://genome.ucsc.edu/
Ensembl: https://www.ensembl.org/
NCBI Genome Data Viewer: https://www.ncbi.nlm.nih.gov/genome/gdv/

パスウェイ・ネットワーク

ソフトウェアツール・ライブラリ

配列解析

BLAST: 配列類似性検索の標準ツール
BWA: 高速リードマッピング
GATK: 変異検出パイプライン
SAMtools: 配列データ操作

統計解析・機械学習

R/Bioconductor: 生物統計の標準環境
Python/BioPython: 汎用プログラミング
PyTorch/TensorFlow: 深層学習フレームワーク
scikit-learn: 機械学習ライブラリ

可視化

Cytoscape: ネットワーク可視化
IGV: ゲノムブラウザ
matplotlib/seaborn: Python可視化
ggplot2: R可視化

オンライン学習リソース

MOOCs・講義動画

Coursera “Bioinformatics Specialization” (UC San Diego)
edX “Introduction to Computational Biology” (Harvard)
東京大学医科学研究所公開講座

プログラミング演習

Rosalind: https://rosalind.info/ — バイオインフォマティクス問題集
Kaggle: 機械学習コンペティション
Google Colab: 無料GPU環境

技術ドキュメント

BioPython Tutorial and Cookbook
R for Data Science (生物学応用版)
TensorFlow Tutorials for Biology

技術標準・プロトコル

データ形式標準

FASTA: 配列データの標準形式
SAM/BAM: アライメント結果形式
VCF: 変異情報形式
GFF/GTF: ゲノム注釈形式

API・Webサービス

NCBI E-utilities: プログラマティックアクセス
Ensembl REST API: ゲノム情報取得
UniProt REST API: タンパク質情報

優先章別の次の一歩

第4章の次の一歩

まずは「主要データベース・リソース」を確認し、参照配列と注釈の入手経路を固定する
次に「ソフトウェアツール・ライブラリ」から BWA / SAMtools / GATK / bcftools の役割を整理する
SRR11140744 と MN908947.3 を題材に、最小パイプラインの再現メモを残す

第7章の次の一歩

「統計解析・機械学習」の節を起点に、評価指標、データ分割、解釈性を再確認する
TCGA-LUAD のような公開コホートを研究用途で扱い、用途制約を必ず明記する
付録Kを参照し、特徴量、リーク、AUROC などの用語を固定してから再実験する

第10章の次の一歩

「主要データベース・リソース」を見直し、保存対象となる成果物の粒度を明確にする
genomic_variants、sample_metadata、analysis_run のような最小スキーマを自分の題材へ写像する
EXPLAIN ANALYZE の結果と運用上の制約を併記し、性能だけで判断しない

第12章の次の一歩

研究用データと臨床利用の境界を明確にし、同意・匿名化・監査の前提を先に書く
第10章のスキーマ設計と合わせて、レポート候補へ必要な由来情報を洗い出す
用語や証拠水準に迷ったら、付録Kと付録Gの該当項目へ戻る

第14章の次の一歩

SRR11140744 と TCGA-LUAD のどちらかを選び、目的、入力、制約、成果物を 1 ページで再整理する
ケースごとに、何を自動化し、何を人手レビューに残すかを記録する
自分の業務や研究に近いケースへ横展開する際は、付録Jの題材一覧を起点にする

継続学習のための指針

技術トレンド追跡

arXiv.org cs.CE (Computational Engineering)
bioRxiv: 生物学プレプリントサーバ
GitHub: オープンソースプロジェクト

実践プロジェクト

公共データを用いた再現解析
新規アルゴリズムの実装・評価
既存手法の改良・最適化
学際的共同研究への参画

スキル開発ロードマップ

🧪 概念例（擬似コード）

初級 (0〜6ヶ月):
- プログラミング基礎 (Python/R)
- 生物学基礎知識
- 基本的な統計解析

中級 (6ヶ月〜2年):
- アルゴリズム実装
- 機械学習手法
- データベース設計

上級 (2年以上):
- 新規手法開発
- 大規模システム設計
- 学際的研究リーダーシップ

バイオインフォマティクス実践ガイド

付録F: 参考資料

更新日・選定基準

2024–2025の主要トピック（追加分）

必読書籍

基礎理論

実装・応用

主要学術ジャーナル

計算生物学専門誌

応用・学際誌

主要データベース・リソース

配列データベース

ゲノムブラウザ

パスウェイ・ネットワーク

ソフトウェアツール・ライブラリ

配列解析

統計解析・機械学習

可視化

オンライン学習リソース

MOOCs・講義動画

プログラミング演習

技術ドキュメント

技術標準・プロトコル

データ形式標準

API・Webサービス

関連学会・コミュニティ

国際学会

国内学会

優先章別の次の一歩

第4章の次の一歩

第7章の次の一歩

第10章の次の一歩

第12章の次の一歩

第14章の次の一歩

継続学習のための指針

技術トレンド追跡

実践プロジェクト

スキル開発ロードマップ