找出cluster的差异基因并进行GO和KEGG分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了找出cluster的差异基因并进行GO和KEGG分析相关的知识,希望对你有一定的参考价值。

参考技术A 单细胞测序数据经Seurat包tsne降维聚类后,得到cluster,如何找出cluster的marker并进行GO、KEGG分析

需要R包:Seurat、clusterProfiler、ggplot2

GO/KEGG功能富集分析及气泡图

何为功能富集分析?

功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的。换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生物学表型关联起来。

何为GO和KEGG?

为了解决将基因按照功能进行分类的问题,科学家们开发了很多基因功能注释数据库,。这其中比较有名的一个就是Gene Ontology(基因本体论,GO)和Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书,KEGG)。

其中,GO是基因本体论联合会建立的一个数据库,旨在建立一个适用于各种物种的、对基因和蛋白功能进行限定和描述的、并能够随着研究不断深入而更新的语义词汇标准。GO注释分为三大类:分子生物学功能(Molecular Function,MF)、生物学过程(Biological Process,BP)和细胞学组分(Cellular Components,CC),通过这三个功能大类,对一个基因的功能进行多方面的限定和描述。

而KEGG,大多数人会将其当做一个基因通路(Pathway)的数据库,其实KEGG的功能远不止于此。KEGG是一个整合了基因组、化学和系统功能信息的综合数据库。KEGG下属4个大类和17个子数据库,而其中有一个数据库叫做 KEGG Pathway,专门存储不同物种中基因通路的信息,也是用的最多的一个,久而久之,KEGG被大家当做一个通路数据库了。

下面两个图展示了GO和KEGG Pathway的面貌。

技术图片

 

技术图片

 

如何做功能富集分析?

做功能富集分析的算法有很多,能够做功能富集分析的工具也非常多,见下面的列表

技术图片

 

 Funrich 也可以做功能富集分析

以上的工具中,DAVID最为常用也最为权威。DAVID是由美国Leidos生物医学研究公司的LHRI团队开发的一个在线基因注释及功能富集网站(https://david.ncifcrf.gov/)

使用DAVID做功能富集分析

 

以上是关于找出cluster的差异基因并进行GO和KEGG分析的主要内容,如果未能解决你的问题,请参考以下文章

RNA-Seq(9):使用GSEA做GO/KEGG富集分析

GO、KEGG富集分析(一)有参情况

go,kegg,gsea的取舍(一)

GO富集分析简单介绍

单细胞之富集分析-3:GO和KEGG富集分析及绘图

GO和Pathway富集分析的背景基因集