付録F: 参考資料

更新日・選定基準

  • 最終更新日: 2026-01-24
  • 選定基準:
    • 本文で参照する概念・手法に直接関係する
    • 初学者が一次情報に到達できる
    • 実務での利用頻度が高い

2024–2025の主要トピック(追加分)

  • AlphaFold 3 / AlphaFold Server
  • AlphaFold DB 2025
  • scGPT
  • Nicheformer
  • Nucleotide Transformer
  • AlphaMissense
  • T2T-CHM13(完全ヒトゲノム)
  • ヒト・パンゲノム参照
  • DeepVariant

必読書籍

基礎理論

  1. “Bioinformatics Algorithms” - Compeau & Pevzner
    • アルゴリズム理論と実装の標準的テキスト
  2. “Introduction to Computational Biology” - Waterman
    • 数学的基礎から応用まで網羅
  3. “Pattern Recognition and Machine Learning” - Bishop
    • 機械学習の理論的基盤

実装・応用

  1. “Programming for Bioinformatics” - Allison
    • 実装技術の詳細ガイド
  2. “Computational Molecular Biology” - Pevzner
    • アルゴリズム設計の実践的手法
  3. “Systems Biology” - Klipp et al.
    • システム生物学の数理モデル

主要学術ジャーナル

計算生物学専門誌

  • Bioinformatics (Oxford Academic): IF 5.8
  • PLoS Computational Biology: オープンアクセス
  • BMC Bioinformatics: 手法論重視
  • Journal of Computational Biology: 理論・応用バランス

応用・学際誌

  • Nature Methods: 手法開発のトップジャーナル
  • Genome Research: ゲノム解析技術
  • Cell Systems: システム生物学
  • Science Translational Medicine: 臨床応用

主要データベース・リソース

配列データベース

ゲノムブラウザ

パスウェイ・ネットワーク

ソフトウェアツール・ライブラリ

配列解析

  • BLAST: 配列類似性検索の標準ツール
  • BWA: 高速リードマッピング
  • GATK: 変異検出パイプライン
  • SAMtools: 配列データ操作

統計解析・機械学習

  • R/Bioconductor: 生物統計の標準環境
  • Python/BioPython: 汎用プログラミング
  • PyTorch/TensorFlow: 深層学習フレームワーク
  • scikit-learn: 機械学習ライブラリ

可視化

  • Cytoscape: ネットワーク可視化
  • IGV: ゲノムブラウザ
  • matplotlib/seaborn: Python可視化
  • ggplot2: R可視化

オンライン学習リソース

MOOCs・講義動画

  • Coursera “Bioinformatics Specialization” (UC San Diego)
  • edX “Introduction to Computational Biology” (Harvard)
  • 東京大学医科学研究所公開講座

プログラミング演習

  • Rosalind: https://rosalind.info/ — バイオインフォマティクス問題集
  • Kaggle: 機械学習コンペティション
  • Google Colab: 無料GPU環境

技術ドキュメント

  • BioPython Tutorial and Cookbook
  • R for Data Science (生物学応用版)
  • TensorFlow Tutorials for Biology

技術標準・プロトコル

データ形式標準

  • FASTA: 配列データの標準形式
  • SAM/BAM: アライメント結果形式
  • VCF: 変異情報形式
  • GFF/GTF: ゲノム注釈形式

API・Webサービス

  • NCBI E-utilities: プログラマティックアクセス
  • Ensembl REST API: ゲノム情報取得
  • UniProt REST API: タンパク質情報

関連学会・コミュニティ

国際学会

  • ISMB (Intelligent Systems for Molecular Biology)
  • RECOMB (Research in Computational Molecular Biology)
  • PSB (Pacific Symposium on Biocomputing)

国内学会

  • 日本バイオインフォマティクス学会
  • 情報処理学会バイオ情報学研究会
  • 日本分子生物学会

優先章別の次の一歩

第4章の次の一歩

  • まずは「主要データベース・リソース」を確認し、参照配列と注釈の入手経路を固定する
  • 次に「ソフトウェアツール・ライブラリ」から BWA / SAMtools / GATK / bcftools の役割を整理する
  • SRR11140744MN908947.3 を題材に、最小パイプラインの再現メモを残す

第7章の次の一歩

  • 「統計解析・機械学習」の節を起点に、評価指標、データ分割、解釈性を再確認する
  • TCGA-LUAD のような公開コホートを研究用途で扱い、用途制約を必ず明記する
  • 付録Kを参照し、特徴量、リーク、AUROC などの用語を固定してから再実験する

第10章の次の一歩

  • 「主要データベース・リソース」を見直し、保存対象となる成果物の粒度を明確にする
  • genomic_variantssample_metadataanalysis_run のような最小スキーマを自分の題材へ写像する
  • EXPLAIN ANALYZE の結果と運用上の制約を併記し、性能だけで判断しない

第12章の次の一歩

  • 研究用データと臨床利用の境界を明確にし、同意・匿名化・監査の前提を先に書く
  • 第10章のスキーマ設計と合わせて、レポート候補へ必要な由来情報を洗い出す
  • 用語や証拠水準に迷ったら、付録Kと付録Gの該当項目へ戻る

第14章の次の一歩

  • SRR11140744TCGA-LUAD のどちらかを選び、目的、入力、制約、成果物を 1 ページで再整理する
  • ケースごとに、何を自動化し、何を人手レビューに残すかを記録する
  • 自分の業務や研究に近いケースへ横展開する際は、付録Jの題材一覧を起点にする

継続学習のための指針

技術トレンド追跡

  • arXiv.org cs.CE (Computational Engineering)
  • bioRxiv: 生物学プレプリントサーバ
  • GitHub: オープンソースプロジェクト

実践プロジェクト

  1. 公共データを用いた再現解析
  2. 新規アルゴリズムの実装・評価
  3. 既存手法の改良・最適化
  4. 学際的共同研究への参画

スキル開発ロードマップ

🧪 概念例(擬似コード)

初級 (0〜6ヶ月):
- プログラミング基礎 (Python/R)
- 生物学基礎知識
- 基本的な統計解析

中級 (6ヶ月〜2年):
- アルゴリズム実装
- 機械学習手法
- データベース設計

上級 (2年以上):
- 新規手法開発
- 大規模システム設計
- 学際的研究リーダーシップ