KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个整合了基因组、化学和系统功能信息的数据库[1],各个数据库中包含了大量的有用信息:基因组信息存储在GENES数据库里,包括完整和部分测序的基因组序列;更高级的功能信息存储在PATHWAY数据库里,包括图解的细胞生化过程如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息;KEGG的另一个数据 库是LIGAND,包含关于化学物质、酶分子、酶反应等信息。

KEGG提供的整合代谢途径(pathway)查询十分出色,包括碳水化合物、核苷、氨基酸等的代谢及有机物的生物降解,不仅提供了所有可能的代谢途径,而且对催化各步反应的酶进行了全面的注解,包括氨基酸序列、PDB库的链接等。KEGG是进行生物体内代谢分析、代谢网络研究的强有力工具,它有助于研究者把基因及其表达信息作为一个整体网络进行研究。

MetPA是metaboanalyst(www .metaboanalyst.ca)的一部分,主要基于KEGG代谢通路。MetPA数据库通过代谢通路浓缩和拓扑分析,识别出可能的受生物扰动的代谢通路,进而对代谢物的代谢通路进行分析。采用MetPA数据库可以分析两组差异代谢物的相关代谢通路,采用的数据分析算法是超几何检验,pathway拓扑结构采用的是Relative-betweeness Centrality。

基于上述MetPA分析结果,根据代谢通路中鉴定代谢物的相对响应值和降维算法,获得代谢通路的相对响应值,并以此计算代谢通路间的相关系数,绘制代谢通路关联网络图。