基因富集分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基因富集分析相关的知识,希望对你有一定的参考价值。

参考技术A 拿到自己数据中的上调与下调的基因list后,尝试用在线小工具做一下基因富集分析

1.DAVID+kobas

先用David工具将自己数据中得到的基因名转换成geneid,然后进入kobas将geneid输入,即可得到富集的通路。

DAVID: Functional Annotation Result Summary (ncifcrf.gov)

http://kobas.cbi.pku.edu.cn/anno_iden.php

遇到一个小小问题,在物种选择那里,我的小鼠是C57BL/6J小鼠,但是选项中那么多不知道是哪个。如果选错的话,gene名转换成geneid这步可能会有一点问题。

2. 直接采用metascape网站,一步完成geneid转化和富集分析两个步骤

Metascape

挺好的网站,还能可视化。爱了爱了。

非模式生物GO、KEGG富集分析

参考技术A GO、KEGG富集分析是我们做生信分析较为常用的部分,它可以将基因与功能相联系起来。
GO指的是Gene Ontology,是基因功能国际标准分类体系。目的在于建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(Molecular Function)(MF)、生物过程(Biological Process)(BP)、和细胞组成(Cellular Component)(CC)三个部分。
KEGG指的是京都基因与基因组百科全书,通常我们使用KEGG中的pathway模块,将基因映射到某些通路上,了解基因参与生物体中的代谢过程等。
对于模式生物,GO和KEGG富集分析实现起来比较容易,对于非模式生物来说还是需要花点时间和精力。对于模式生物的GO和KEGG富集分析,网上教程案例挺多的。对于非模式生物,以小麦为例,进行下面一些基本的富集分析。

做富集分析,我们需要了解一下几个概念。
1、前景基因:指的是我们所要进行富集的基因,一般是基因的ID
2、背景基因:指的是前景基因在某个基因集合进行富集,这个基因集合就是背景基因

3、描述信息:每个GO的Term的属性,或者是每个KO号或者map号的属性。

我们具备前景基因,背景基因以及描述信息我们就可以做富集分析啦。

1、前景基因:这是必须的啦。有时候需要进行ID转换,但是个人觉得ID转换根据需要来就行。如果前景基因里面的基因ID是包括在背景基因里面,那就需要进行转换。如果前景基因在是新的基因或者在背景基因没有被注释到的,就不用进行ID转换。下面这个就是融合基因,在背景基因里面没有注释到的,那么我就不要转换。

2、背景基因:一个基因可能具备多个GO term,一个基因也可能参与多个通路,与之相对应的有多个map号
这个案例中背景基因文件构建思路如下图

3、描述文件

跑完之后就会得到一些结果:

生成一些简单的气泡图,条形图,GO二级分类图

以上是关于基因富集分析的主要内容,如果未能解决你的问题,请参考以下文章

基因集富集分析 --- GSEA

GO和Pathway富集分析的背景基因集

怎么做基于KEGG的生物通路富集分析

分析 GO 富集分析

GO,KEGG,DO 富集分析

GO富集分析简单介绍