付録A: 環境構築ガイド

本書のコード例を実行するための環境構築手順を説明します。

A.1 必要な環境

推奨環境仕様:

  • OS: Ubuntu 20.04 LTS以降 または macOS 11以降
  • メモリ: 16GB以上(推奨32GB)
  • ストレージ: 100GB以上の空き容量
  • GPU: CUDA対応GPU(深層学習用、オプション)

A.2 Dockerを使用した環境構築

# Dockerfile
FROM ubuntu:20.04

# 基本ツールのインストール
RUN apt-get update && apt-get install -y \
    python3.9 \
    python3-pip \
    r-base \
    git \
    wget \
    build-essential

# Pythonパッケージ
COPY requirements.txt .
RUN pip3 install -r requirements.txt

# Rパッケージ
RUN R -e "install.packages('BiocManager')"
RUN R -e "BiocManager::install(c('Biostrings', 'GenomicRanges'))"

# バイオインフォマティクスツール
RUN apt-get install -y \
    bwa \
    samtools \
    bcftools \
    blast2

WORKDIR /workspace

A.3 依存関係管理

# requirements.txt
numpy>=1.20.0,<1.24.0
pandas>=1.3.0,<2.0.0
scipy>=1.7.0,<1.10.0
scikit-learn>=1.0.0,<1.3.0
tensorflow>=2.8.0,<2.12.0
pytorch>=1.10.0,<2.0.0
biopython>=1.79
matplotlib>=3.4.0
seaborn>=0.11.0
jupyterlab>=3.0.0
scanpy>=1.8.0
anndata>=0.8.0

A.4 トラブルシューティング

よくある問題と解決法:

  1. メモリ不足エラー ```python

    メモリ効率的な読み込み

    def read_large_fasta(filename, chunk_size=1000): “"”大きなFASTAファイルをチャンク単位で読み込む””” from Bio import SeqIO

    for i, batch in enumerate(batch_iterator(SeqIO.parse(filename, “fasta”), chunk_size)): yield batch

def batch_iterator(iterator, batch_size): “"”イテレータをバッチに分割””” batch = [] for entry in iterator: batch.append(entry) if len(batch) == batch_size: yield batch batch = [] if batch: yield batch


2. **GPU認識エラー**
```bash
# CUDA環境確認
nvidia-smi
python3 -c "import torch; print(torch.cuda.is_available())"

← 前へ: 参考資料 目次に戻る 次へ: トラブルシューティング →