Skip to content

功能谱分析 vs 分类谱分析

宏基因组数据可从两个维度分析:"谁在那里"(分类谱)"它们在做什么"(功能谱)

两种策略对比

维度分类谱 (Taxonomic Profiling)功能谱 (Functional Profiling)
问题样本中有哪些物种?样本中有哪些代谢通路/基因?
工具MetaPhlAn, Kraken 2HUMAnN 3, eggNOG-mapper
数据库标记基因/基因组参考UniRef, KEGG, MetaCyc
输出物种丰度表通路/基因家族丰度表
计算成本较低较高
生物学洞察群落组成群落功能潜力

分类谱分析

原理

将 reads 映射到已知物种的标记基因或基因组:

Reads → 比对到参考 → 物种分类 → 丰度估计

工具选择

工具方法速度准确度内存
MetaPhlAn 4标记基因
Kraken 2k-mer最快
CentrifugeFM-index
Kaiju蛋白质比对高(远缘)

典型流程

bash
# MetaPhlAn
metaphlan input.fastq --bowtie2db /db --nproc 8 --output_file profile.txt

# Kraken 2 + Bracken
kraken2 --db /db --output kraken.out --report kraken.report input.fastq
bracken -d /db -i kraken.report -o bracken.out -r 150 -l S

功能谱分析

原理

将 reads 映射到蛋白质数据库,然后映射到代谢通路:

Reads → 翻译 → 比对到 UniRef → 映射到通路 → 通路丰度

核心工具:HUMAnN 3

bash
# 基本使用
humann --input input.fastq --output humann_out/ --threads 8

# 输出文件:
# - genefamilies.tsv  (基因家族丰度)
# - pathcoverage.tsv  (通路覆盖度)
# - pathabundance.tsv (通路丰度)

通路数据库

数据库说明适用
UniRef50/90蛋白质聚类通用
KEGG代谢通路代谢分析
MetaCyc代谢通路替代 KEGG
eggNOG直系同源组功能注释

整合分析

最佳实践是同时做分类和功能分析:

bash
# bioBakery 流程
metaphlan input.fastq --bowtie2out mapped.bz2 --output profile.txt
humann --input input.fastq --output humann_out/

然后用 MaAsLin2 做统计关联:

bash
# 分类关联
maaslin2 -i abundance.tsv -m metadata.tsv -o results_taxonomy/

# 功能关联
maaslin2 -i pathabundance.tsv -m metadata.tsv -o results_functional/

参考文献

  1. Beghini et al. (2021) Integrating taxonomic, functional, and strain-level profiling of diverse microbial communities with bioBakery 3. eLife. DOI: 10.7554/eLife.65088
  2. Franzosa et al. (2018) Species-level functional profiling of metagenomes and metatranscriptomes. Nature Methods. DOI: 10.1038/s41592-018-0176-y

最后更新: 2026-03-30

Released under the MIT License.