go，kegg，gsea的取舍（一）

Posted 2023-05-11

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了go，kegg，gsea的取舍（一）相关的知识，希望对你有一定的参考价值。

参考技术A 做的过程中发觉三个都是富集分析，在搜索后，初步的结论是

go，kegg是富集差异显著的基因，gsea是富集差异基因，只要参与，P值在0.049也可以参与富集

但是go，kegg不可以，只能富集显著的

这样的话gsea是对go，kegg的一个补充，可以把不是很显著的基因也做富集分析，从而达到物尽所用，把所有差异基因都可以用上

所以go，kegg之后也可以做gsea，因为就是一个富集分析，只是在文章展示的时候会有筛选，只写好的

go，kegg与用gsea做go，kegg

R包的选择：做go，kegg

R包，然后就是图形展示

用的什么数据，数据格式，直接R包开始就可以

go、kegg尽量用EntrizeID，因为（gene symbol）会引起不必要的缺点（至于为什么。么有测试过，都是别人说的

但是在用symbol转为RntrizeID的时候产生丢掉了一些基因；所以这个在探针转换的时候是否就需要两手准备，一个genesymbol，一个EntrizeID）

非模式生物GO、KEGG富集分析

参考技术A GO、KEGG富集分析是我们做生信分析较为常用的部分，它可以将基因与功能相联系起来。
GO指的是Gene Ontology，是基因功能国际标准分类体系。目的在于建立一个适用于各种物种的，对基因和蛋白质功能进行限定和描述的，并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能（Molecular Function)(MF)、生物过程（Biological Process）(BP)、和细胞组成（Cellular Component）(CC)三个部分。
KEGG指的是京都基因与基因组百科全书，通常我们使用KEGG中的pathway模块，将基因映射到某些通路上，了解基因参与生物体中的代谢过程等。
对于模式生物，GO和KEGG富集分析实现起来比较容易，对于非模式生物来说还是需要花点时间和精力。对于模式生物的GO和KEGG富集分析，网上教程案例挺多的。对于非模式生物，以小麦为例，进行下面一些基本的富集分析。

做富集分析，我们需要了解一下几个概念。
1、前景基因：指的是我们所要进行富集的基因，一般是基因的ID
2、背景基因：指的是前景基因在某个基因集合进行富集，这个基因集合就是背景基因

3、描述信息：每个GO的Term的属性，或者是每个KO号或者map号的属性。

我们具备前景基因，背景基因以及描述信息我们就可以做富集分析啦。

1、前景基因:这是必须的啦。有时候需要进行ID转换，但是个人觉得ID转换根据需要来就行。如果前景基因里面的基因ID是包括在背景基因里面，那就需要进行转换。如果前景基因在是新的基因或者在背景基因没有被注释到的，就不用进行ID转换。下面这个就是融合基因，在背景基因里面没有注释到的，那么我就不要转换。

2、背景基因：一个基因可能具备多个GO term，一个基因也可能参与多个通路，与之相对应的有多个map号
这个案例中背景基因文件构建思路如下图

3、描述文件

跑完之后就会得到一些结果：

生成一些简单的气泡图，条形图，GO二级分类图

以上是关于go，kegg，gsea的取舍（一）的主要内容，如果未能解决你的问题，请参考以下文章

GSEA分析

富集分析第二弹

GO、KEGG富集分析（一）有参情况

下载GO/KEGG某一pathway的genelist

一些GO及KEGG分析的知识

非模式生物GO、KEGG富集分析