付録G: JSBi認定試験の理解補助

概要

この付録は、日本バイオインフォマティクス学会（JSBi）が主催する「バイオインフォマティクス技術者認定試験」について、本文で学んだ内容を試験観点で再整理するための補助資料です。本書の主目的は、IT 技術者が公開データを用いた研究・教育用途の解析を理解し、専門家と協働するための実務導入です。合格を保証する試験対策書ではなく、公式情報へ戻りながら理解範囲を点検するために使ってください。

参考（公式、確認日: 2026-05-12）:

JSBi（2026年度認定試験情報）

JSBi（出題範囲）

JSBi（参考図書）

JSBi（出版事業）

CBT-Solutions（受験者ポータル）

認定試験の基本情報

注: 受験案内、日程、受験料、合否基準、受験会場、公式資料は年度により変更されます。受験を検討する場合は、必ず JSBi の最新公式情報を確認してください。

更新情報（公式確認）

確認日: 2026-05-12
参照元（公式）:
- JSBi（2026年度認定試験情報）: https://www.jsbi.org/activity/nintei/2026/
- JSBi（出題範囲）: https://www.jsbi.org/activity/nintei/shutsudai/
- JSBi（参考図書）: https://www.jsbi.org/activity/nintei/books/
- JSBi（出版事業）: https://www.jsbi.org/publication/books/

項目	2026年度公式情報の要点
実施団体	日本バイオインフォマティクス学会（JSBi）
試験方式	CBT（Computer-Based Testing）方式
受験期間	第1回: 2026年7月11日〜2026年8月9日（予定）第2回: 2026年11月7日〜2026年12月6日（予定）
申込期間	第1回: 2026年4月1日 10:00〜2026年6月11日第2回: 2026年8月3日 10:00〜2026年10月7日
受験資格	問わない
受験料	6,000円（税込）
問題数・形式	60問、4者択一式
試験時間	120分
出題範囲の大枠	生命科学分野、情報科学分野、バイオインフォマティクス分野
公式教科書・参考図書	JSBi は『バイオインフォマティクス入門』を参考図書に掲載し、出版事業ページで公式教科書として案内している

本付録では、上記の公式情報を前提に、本文の章と試験観点を対応づけます。キーワードや例題は本書独自の整理であり、公式問題、出題傾向、合格基準を代表するものではありません。

G.1 出題範囲と本書の対応表

生命科学分野

分子生物学

認定試験キーワード	本書対応章節	重要度	学習ポイント
セントラルドグマ	第1章 1.0.1節	★★★	DNA→RNA→タンパク質の基本流れ
遺伝子構造（コドン、ORF、スプライシング）	第1章 1.0節第5章 5.3節	★★★	真核生物と原核生物の違い
プロモーター	第6章 6.1節	★★	転写開始に関わる制御領域
ウイルス	前提知識	★	巨大ウイルスの存在も含む
遺伝子組換え	第1章 1.0節	★	基本的な実験手法

ゲノミクス・オミクス技術

認定試験キーワード	本書対応章節	重要度	学習ポイント
次世代シークエンサ（NGS）	第4章 4.1節	★★★	技術原理と特徴
ショットガン法	第4章 4.1節	★★	ゲノムアセンブリ手法
de novoアセンブリ	第4章 4.3節	★★	リファレンスフリーな配列決定
マイクロアレイ	第5章 5.1節	★	発現解析の従来技術
質量分析	第1章 1.5節	★	プロテオミクス・メタボロミクス
X線結晶構造解析、NMR	付録G G.3節（PDB）付録H H.5節	★	構造解析手法

情報科学分野

コンピュータシステム

認定試験キーワード	本書対応章節	重要度	学習ポイント
2進数、論理演算	前提知識（CS基礎）	★★	基本的な情報表現
浮動小数点数、誤差	前提知識（CS基礎）	★★	数値計算の注意点
プログラミング言語（Python、R）	付録A（環境構築）	★★★	実践的なプログラミング能力
ネットワーク（OSI参照モデル、IPアドレス）	前提知識（ネットワーク基礎）	★	基本的なネットワーク知識
マークアップ言語（HTML、XML）	前提知識（Web/データ表現）	★	データ記述形式

アルゴリズムとデータ構造

認定試験キーワード	本書対応章節	重要度	学習ポイント
スタック、キュー、木構造	前提知識（データ構造基礎）	★★	基本的なデータ構造
探索（二分探索、ハッシュ）	前提知識（探索アルゴリズム）	★★	効率的な検索手法
ソーティング	前提知識（ソート）	★	基本的なアルゴリズム
時間計算量、空間計算量	第3章 3.0節	★★	アルゴリズムの効率性評価

データベース技術

認定試験キーワード	本書対応章節	重要度	学習ポイント
データモデル（リレーショナル型）	第10章 10.1節	★★	データベースの基本概念
SQL	第10章 10.1.1節	★★	データベース操作言語

確率・統計

認定試験キーワード	本書対応章節	重要度	学習ポイント
確率分布、ベイズの定理	前提知識（統計基礎）	★★★	統計解析の基礎
平均、分散、相関、回帰	前提知識（統計基礎）	★★★	記述統計・推測統計
仮説検定（有意水準、p値）	第5章 5.2節第9章 9.1節	★★★	統計的推論の基本

機械学習

認定試験キーワード	本書対応章節	重要度	学習ポイント
決定木、k-NN、ニューラルネットワーク、SVM	第7章 7.1-7.3節	★★	基本的な機械学習手法
感度、特異度、交差検証	第7章 7.1節	★★	モデル評価手法
クラスタリング（K-means、SOM）	第7章 7.2節	★★	教師なし学習

バイオインフォマティクス分野

データベース

認定試験キーワード	本書対応章節	重要度	学習ポイント
文献DB（PubMed）	付録G G.3節（NCBI）付録H H.6節	★★	文献検索データベース
ゲノムDB（NCBI）	付録I I.2節付録H H.6節	★★★	主要なゲノムデータベース
塩基配列DB（GenBank/DDBJ）	付録I I.2節付録H H.6節	★★★	配列データの標準データベース
アミノ酸配列DB（UniProt）	付録I I.2節付録H H.6節	★★★	タンパク質配列・機能データベース
立体構造DB（PDB）	付録G G.3節（PDB）付録H H.6節	★★	タンパク質構造データベース
パスウェイDB（KEGG）	第5章 5.2節付録H H.6節	★★	代謝経路データベース
遺伝子オントロジー（GO）	第5章 5.2節付録H H.6節	★★	遺伝子機能分類体系

配列解析

認定試験キーワード	本書対応章節	重要度	学習ポイント
配列アライメント（動的計画法）	第3章 3.2節	★★★	基本的な配列比較手法
相同性検索（BLAST、ハッシング）	第3章 3.2節	★★★	最重要な解析ツール
スコアリング行列（PAM、BLOSUM）	第3章 3.2節	★★	配列比較の評価基準
隠れマルコフモデル（HMM）	第3章 3.5節	★★	確率的配列解析手法
モチーフ解析（正規表現）	第6章第7章	★★	保存配列・転写因子結合モチーフの検出（正規表現は前提知識）
遺伝子発見、比較ゲノミクス	第1章 1.0節	★★	ゲノム解析の応用

構造バイオインフォマティクス

認定試験キーワード	本書対応章節	重要度	学習ポイント
構造表現（ラマチャンドランプロット）	付録H H.5.2節	★	タンパク質構造の評価
構造比較（RMSD）	付録H H.5.2節	★	構造類似性の定量評価
二次・三次構造予測	第7章 7.3節付録H H.5.1節	★	配列からの構造予測
ホモロジーモデリング、スレッディング	付録H H.5.1節	★	構造予測手法

遺伝・進化

認定試験キーワード	本書対応章節	重要度	学習ポイント
ゲノムワイド関連解析（GWAS）	第9章 9.1節	★★	疾患関連遺伝子の同定
ハプロタイプ、SNP、CNV	第9章 9.1節	★★	遺伝的変異の種類
分子系統解析	第9章 9.3節	★★	進化関係の推定

システム生物学・オミクス解析

認定試験キーワード	本書対応章節	重要度	学習ポイント
遺伝子発現クラスタリング	第7章 7.2節	★★	発現パターンの分類
ネットワーク解析（スケールフリー、ハブ）	第3章 3.3節	★★	生物学的ネットワークの特徴
パスウェイ解析	第5章 5.2節	★★	代謝経路の解析
メタボローム解析	第1章 1.5節	★	代謝物質の網羅的解析

重要度の説明:

★★★: 関連章を読む前に押さえたい
★★: 関連章とあわせて理解したい
★: 概要を把握しておく

G.2 頻出プログラム・ツール一覧表

分野	プログラム/ツール名	主な機能	入力形式	出力形式	関連章/付録	本文での確認優先度
配列解析
	BLAST	配列類似性検索	FASTA	テキスト/XML	第3章	★★★
	BWA	ショートリード配列マッピング	FASTQ	SAM/BAM	第4章	★★
	Bowtie2	高速配列マッピング	FASTQ	SAM	第4章	★★
	HMMER	HMMによる配列解析	FASTA	テキスト	付録H	★★
	ClustalW/Clustal Omega	多重配列アライメント	FASTA	アライメント形式	付録H	★★
ゲノム解析
	SAMtools	SAM/BAMファイル操作	SAM/BAM	各種形式	第4章	★★
	GATK	変異検出・品質管理	BAM	VCF	第4章	★★
	VCFtools	VCFファイル操作	VCF	統計情報	第4章	★
	IGV	ゲノムビューア	各種形式	可視化	第4章	★
アセンブリ
	SPAdes	ゲノムアセンブリ	FASTQ	FASTA	第4章	★★
	Velvet	ショートリードアセンブリ	FASTQ	FASTA	第4章	★
	Canu	ロングリードアセンブリ	FASTQ	FASTA	第4章	★
RNA-seq解析
	TopHat/HISAT2	RNA-seqマッピング	FASTQ	SAM/BAM	第5章	★★
	Cufflinks	転写産物アセンブリ	BAM	GTF	第5章	★
	STAR	高速RNAマッピング	FASTQ	SAM/BAM	第5章	★★
	DESeq2	発現差分解析	カウントデータ	統計結果	第5章	★★
	edgeR	発現差分解析	カウントデータ	統計結果	第5章	★★
系統解析
	MEGA	系統解析統合環境	配列データ	系統樹	第9章	★★
	PHYLIP	系統解析パッケージ	配列データ	系統樹	第9章	★
	RAxML	最尤法系統解析	配列データ	系統樹	第9章	★
構造解析
	PyMOL	分子構造可視化	PDB	画像	付録H	★
	ChimeraX	分子構造解析	PDB	画像/解析結果	付録H	★
	SWISS-MODEL	ホモロジーモデリング	配列	PDB	付録H	★

確認優先度の説明:

★★★: 本文理解の前提として優先度が高い
★★: 関連章とあわせて理解したい
★: 概要を把握しておく

G.3 主要データベース利用ガイド

NCBI（National Center for Biotechnology Information）

URL: https://www.ncbi.nlm.nih.gov/

主要データベース:

GenBank: 塩基配列データベース
RefSeq: 高品質な参照配列
PubMed: 生物医学文献データベース
SRA: 次世代シーケンシングデータ
dbSNP: 遺伝的変異データベース

基本的な使い方:

トップページから目的のデータベースを選択
検索ボックスにキーワードや配列を入力
検索結果を絞り込み、目的のエントリを選択
必要に応じてデータをダウンロード

理解確認ポイント:

各データベースの特徴と用途を理解する
アクセッション番号の体系を知る
BLAST検索の使い方を覚える

UniProt（Universal Protein Resource）

URL: https://www.uniprot.org/

主要データベース:

UniProtKB/Swiss-Prot: 手動キュレーション済みタンパク質データ
UniProtKB/TrEMBL: 自動アノテーション済みタンパク質データ

基本的な使い方:

トップページの検索ボックスにタンパク質名や遺伝子名を入力
検索結果からエントリを選択
機能、構造、相互作用などの情報を確認
必要に応じて配列をダウンロード

理解確認ポイント:

Swiss-ProtとTrEMBLの違いを理解する
タンパク質の機能分類（GO terms）を知る
配列の特徴（ドメイン、モチーフ）の見方を覚える

PDB（Protein Data Bank）

URL: https://www.wwpdb.org/

概要: タンパク質、核酸、複合体の三次元構造データベース

基本的な使い方:

PDB IDまたはタンパク質名で検索
構造エントリの詳細情報を確認
構造ビューアで立体構造を表示
構造データをダウンロード

理解確認ポイント:

X線結晶構造解析、NMR、クライオ電子顕微鏡の違い
分解能の意味と構造の品質指標
立体構造の表現方法（リボン図、空間充填模型など）

KEGG（Kyoto Encyclopedia of Genes and Genomes）

URL: https://www.kegg.jp/

主要データベース:

PATHWAY: 代謝経路、シグナル伝達経路
GENES: 遺伝子カタログ
COMPOUND: 化合物データベース

基本的な使い方:

目的の生物種や経路名で検索
パスウェイマップを表示
遺伝子や化合物の詳細情報を確認
関連する経路を探索

理解確認ポイント:

主要な代謝経路（解糖系、TCA回路など）の理解
パスウェイ解析の基本概念
KEGG identifierの体系

G.4 重要用語集

生物学・情報科学・バイオインフォマティクス

【A】

アライメント（Alignment）: 配列の対応関係を示す配列比較結果
アノテーション（Annotation）: ゲノムや配列に機能情報を付与すること
アセンブリ（Assembly）: 短い配列断片から長い配列を再構築すること

【B】

BLAST: 配列類似性検索の標準ツール
BLOSUM: アミノ酸置換行列の一種
bit score: BLASTでの配列類似性スコア

【C】

CNV（Copy Number Variation）: 遺伝子のコピー数変異
クラスタリング: データを類似性に基づいてグループ分けする手法
CBT: Computer-Based Testing（コンピュータ試験）

【D】

de novoアセンブリ: 参照配列を使わないゲノム組み立て
動的計画法: アライメント作成に用いられるアルゴリズム

【E】

E-value: BLASTでの統計的有意性を示す値
エピゲノム: DNA配列以外の遺伝情報

【F】

FASTA: 配列データの標準形式
FASTQ: 品質スコア付き配列データ形式

【G】

GWAS: ゲノムワイド関連解析
GO（Gene Ontology）: 遺伝子機能の標準分類体系

【H】

ハプロタイプ: 染色体上の連鎖した遺伝的変異のセット
HMM: 隠れマルコフモデル

【N】

NGS: 次世代シークエンサー
ニューラルネットワーク: 脳の神経回路を模した機械学習手法

【O】

ORF（Open Reading Frame）: 開始コドンから終止コドンまでの領域
オミクス: 生体分子の網羅的解析

【P】

PAM: アミノ酸進化距離を表す置換行列
p値: 統計的仮説検定での有意確率
PCR: ポリメラーゼ連鎖反応

【R】

RNA-seq: RNAの網羅的配列解析
RMSD: 構造間の原子座標のずれを表す指標

【S】

SNP（Single Nucleotide Polymorphism）: 一塩基多型
セントラルドグマ: DNA→RNA→タンパク質の情報の流れ
SVM（Support Vector Machine）: サポートベクターマシン

G.5 理解確認用の例題

本節の例題は本書独自の理解確認用です。公式問題、出題傾向、60問分の出題構成を代表するものではありません。公式の参考問題・過去問題は JSBi の最新ページを確認してください。

生命科学分野

問1. セントラルドグマに関する記述として最も適切なものはどれか。

A) DNA→RNA→タンパク質の情報の流れは一方向性である B) 逆転写酵素の発見により、RNA→DNAの情報の流れも明らかになった
C) プリオンはタンパク質のみで遺伝情報を伝達する D) 上記のすべてが正しい

正解: D 解説: セントラルドグマは基本的に一方向性だが、逆転写酵素やプリオンなど例外も存在する。

問2. 次世代シークエンサー（NGS）の特徴として正しくないものはどれか。

A) 大量並列処理により高いスループットを実現 B) Sanger法と比較して1リードあたりの配列長が短い C) 1塩基あたりのコストが従来法より低下する傾向がある D) エラー率は従来のSanger法より低い

正解: D 解説: NGSは一般的にSanger法よりもエラー率が高い。

情報科学分野

問3. 動的計画法を用いる配列アライメントアルゴリズムとして最も適切なものはどれか。

A) Needleman-Wunsch法とSmith-Waterman法 B) BLAST検索とFASTA検索 C) k-means法とSOM法 D) 決定木とランダムフォレスト

正解: A 解説: Needleman-Wunsch法（グローバルアライメント）とSmith-Waterman法（ローカルアライメント）は動的計画法を使用。

問4. 統計的仮説検定において、第一種の過誤（α エラー）とは何か。

A) 帰無仮説が真であるのに、これを棄却してしまう過誤 B) 帰無仮説が偽であるのに、これを採択してしまう過誤 C) サンプルサイズが小さいことによる過誤 D) 測定誤差による過誤

正解: A 解説: 第一種の過誤は「偽陽性」とも呼ばれ、有意水準αで制御される。

バイオインフォマティクス分野

問5. BLASTでのE-valueの解釈として最も適切なものはどれか。

A) E-valueが小さいほど配列の類似性が高い B) E-valueが大きいほど統計的に有意である C) E-valueは常に0から1の間の値をとる D) E-valueはデータベースサイズに依存しない

正解: A 解説: E-valueが小さいほど偶然による一致の可能性が低く、類似性が高いことを示す。

問6. UniProtデータベースに関する記述として正しいものはどれか。

A) Swiss-Protは自動アノテーションによるデータベースである B) TrEMBLは手動キュレーション済みのデータベースである C) Swiss-Protの方がTrEMBLよりも信頼性が高い D) UniProtは核酸配列のみを扱うデータベースである

正解: C 解説: Swiss-Protは手動キュレーション、TrEMBLは自動アノテーションによるタンパク質データベース。

学習方法とスケジュール

推奨学習期間: 3〜6ヶ月

第1段階（1〜2ヶ月）: 基礎固め

本書第1章で分野全体の概要を把握
JSBiが公式教科書として案内する『バイオインフォマティクス入門』を確認
基本用語と概念の理解

第2段階（2〜3ヶ月）: 知識の深化

本書の関連章を詳細に学習
過去問題を解いて弱点を特定
不足分野の補強学習

第3段階（1ヶ月）: 理解確認

理解確認用例題での最終確認
重要用語の暗記
試験形式に慣れる練習

効果的な学習法

体系的学習: キーワードリストに基づいた体系的な学習
実践的理解: ツールやデータベースの実際の使用経験
反復学習: 重要概念の繰り返し確認
問題演習: 公式の参考問題・過去問題と本付録の理解確認用例題での練習

バイオインフォマティクス実践ガイド

付録G: JSBi認定試験の理解補助

概要

認定試験の基本情報

G.1 出題範囲と本書の対応表

生命科学分野

分子生物学

ゲノミクス・オミクス技術

情報科学分野

コンピュータシステム

アルゴリズムとデータ構造

データベース技術

確率・統計

機械学習

バイオインフォマティクス分野

データベース

配列解析

構造バイオインフォマティクス

遺伝・進化

システム生物学・オミクス解析

G.2 頻出プログラム・ツール一覧表

関連リソース

G.3 主要データベース利用ガイド

NCBI（National Center for Biotechnology Information）

UniProt（Universal Protein Resource）

PDB（Protein Data Bank）

KEGG（Kyoto Encyclopedia of Genes and Genomes）

G.4 重要用語集

生物学・情報科学・バイオインフォマティクス

G.5 理解確認用の例題

生命科学分野

情報科学分野

バイオインフォマティクス分野

学習方法とスケジュール

推奨学習期間: 3〜6ヶ月

効果的な学習法

関連リソース

公式リソース

推奨図書

オンライン学習リソース