代谢组学常见数据库列表和简介

Posted 修罗神天道

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了代谢组学常见数据库列表和简介相关的知识,希望对你有一定的参考价值。

新一代的代谢组学 (Next-Generation Metabolomics),在全世界范围内都是刚刚兴起。随着仪器分析工具的迅猛发展,代谢组学的研究也逐年增多,成为后基因组学时代,系统生物学的主要研究手段之一。代谢组分析产生了大量的生物信息数据 (Big Data) 。 代谢数据库的开发对于归纳总结这些大数据、方便后续的代谢组学数据分析、揭示隐藏在大数据背后的生物学机理具有十分重要的作用。本文归纳总结了代谢组学研究和分析检测常用的一些国外的代谢组学数据库,为从事代谢组学研究和应用方面工作的科研人员提供方便。

Human Metabolome Database

简介和特点:Human Metabolome Database (HMDB) 数据库是由加拿大代谢组学创新中心[The Metabolomics Innovation Centre (TMIC)] 于2007年创立的代谢组学综合数据库。网站主要收录人体内源性代谢产物,包括化合物简介、化学式、分子量、化学分类、化学性质、代谢通路、部分代谢产物的浓度,部分MS/MS图谱等。该数据库目前化合物名字搜索、分子量搜索、分子结构搜索, MS/MS 搜索。

该数据库的主要缺点:目前不支持批量搜索,仅限于单个代谢产物搜索,搜索效率较低。不支持代谢通路搜索、代谢化合物浓度搜索等。

Metlin-Scripps Center Metabolomics

简介和特点:Metlin数据库,是由TheScripps Institute  Gary Siuzdak组创立,主要侧重用于非靶向代谢组学(Non-targeted Metabolomics) 代谢产物鉴定用。 网站的主要特征是具有大量的代谢产物的MS/MS图谱,而且每个化合物物都有不同的碰撞能图谱,可以清晰的找到代谢产物的碎片离子。用户还可以获得分子量,化学结构式,化学结构等信息。

该数据库的主要缺陷:没有代谢产物在生物体中的浓度,代谢通路等信息。没有临床相关的信息,偏重于化学分析。

KEGG-Kyoto Encyclopedia of Gene and Genomes

简介和特点:KEGG 数据库,是由日本京都大学于1995年创立,是世界上最大、最全的生物信息学数据库之一。含有部分代谢组学信息。主要偏重于代谢通路和整合代谢、基因和蛋白通路信息。目前还有372条代谢通路和超过15000个各类代谢产物(动物、植物和细菌等)。


Metabolic pathways

缺陷:该数据库最大特点是收录全,包括基因、蛋白和代谢产物等信息,但是缺少这些代谢产物在生物体内的浓度、功能和疾病相关信息。

Metabolic & Genetic Information Center

简介和特点:Metabolic&Genetic InformationCenter(Metagene) 是由德国科学家创立的一个侧重临床诊断和疾病的数据库。数据库侧重于基因标记物,但是也含有部分的代谢产物、代谢产物相关疾病信息,临床诊断等。目前使用人比较少,主要缺点是数据库结构安排不清晰。没有相关代谢产物浓度信息。

GMD-The Golm Metabolome Database

简介和特点:The Golm Metabolome Database (GMD) 数据库,也是由德国Max Planck的科学家建立的植物代谢组学数据库。 侧重于非靶向代谢组学。 该数据库的最大特点是含有大量的植物代谢产物的GC-MS 图谱(特别是衍生化后的),用户可以导入自己GC-MS 数据进行搜索比对和鉴定。另外,该数据库还含有部分代谢产物在植物中的浓度,可以按照植物名、部位等进行搜索。

缺陷:该数据库仅仅收录了植物的代谢组,没有其他生物的信息。大量GC-MS 图谱,但是由于GC-MS检测样品处理麻烦,灵敏度低,特异性差等特点,在代谢组学中的应用正在逐步减少。目前基于GC-MS进行的代谢组学研究,已经很难进入主流高水平杂志发表。而此数据库缺少LC-MS/MS谱图,这限制了这个数据库的应用。

BiGG Models

简介和特点:BiGG Models 是由美国University of California, San Diego 创立的基于代谢组学的系统生物学整合数据库。 该数据库的最大特点是含有各类模式生物的代谢谱图模型。用户可以直观的调取各种生物的整体代谢通路,也可以查看某个具体的生化反应。同时也可以进行代谢产物搜索。该数据库目前含有2766个代谢产物和3311条代谢生化反应。

缺陷:仅仅描述了代谢通路和生化反应信息,缺少代谢产物绝对浓度,以及其临床应用和意义方面信息。

HumanCyc

简介和特点:HumanCyc是描述人类代谢通路和基因组信息的数据库。由美国SRI International开发和维护。该数据库主要特点是有人体细胞内代谢通路总体图,用户可以点击扩大或者缩小查看具体的某个代谢通路。点击某个节点(代谢产物),可以获得该代谢产物的化学结构图,化学式,以及相应的生化反应。

以上是关于代谢组学常见数据库列表和简介的主要内容,如果未能解决你的问题,请参考以下文章

代谢组学数据分析的统计学方法综述

代谢组学2.代谢物鉴定

干货 | 浅谈代谢组学常用数据库类型

r LOESS校正代谢组学数据

代谢组学3.数据分析

从一百万个数据库查询中确定守恒代谢生物标记物