单细胞之富集分析-3:GO和KEGG富集分析及绘图

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了单细胞之富集分析-3:GO和KEGG富集分析及绘图相关的知识,希望对你有一定的参考价值。

参考技术A 单细胞富集分析系列:

单细胞富集分析我最常用的是 分组GSVA ,但最近用到了GO分析,就复习一下GO和KEGG富集分析及绘图。

载入无比熟悉的pbmc.3k数据集 (已注释好,数据准备见 monocle )

pbmc3k数据集只有1个样本,没办法区分HC和病例组。
若有分组,可以使用subset函数将某种细胞取出,来做这种细胞病例组和对照组相比的差异基因和富集分析

之所以长短不齐不按顺序是因为没有排序

排完续之后再画p值就是按顺序的了

附: 单细胞测序数据的差异表达分析方法总结

GO/KEGG功能富集分析及气泡图

何为功能富集分析?

功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的。换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生物学表型关联起来。

何为GO和KEGG?

为了解决将基因按照功能进行分类的问题,科学家们开发了很多基因功能注释数据库,。这其中比较有名的一个就是Gene Ontology(基因本体论,GO)和Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书,KEGG)。

其中,GO是基因本体论联合会建立的一个数据库,旨在建立一个适用于各种物种的、对基因和蛋白功能进行限定和描述的、并能够随着研究不断深入而更新的语义词汇标准。GO注释分为三大类:分子生物学功能(Molecular Function,MF)、生物学过程(Biological Process,BP)和细胞学组分(Cellular Components,CC),通过这三个功能大类,对一个基因的功能进行多方面的限定和描述。

而KEGG,大多数人会将其当做一个基因通路(Pathway)的数据库,其实KEGG的功能远不止于此。KEGG是一个整合了基因组、化学和系统功能信息的综合数据库。KEGG下属4个大类和17个子数据库,而其中有一个数据库叫做 KEGG Pathway,专门存储不同物种中基因通路的信息,也是用的最多的一个,久而久之,KEGG被大家当做一个通路数据库了。

下面两个图展示了GO和KEGG Pathway的面貌。

技术图片

 

技术图片

 

如何做功能富集分析?

做功能富集分析的算法有很多,能够做功能富集分析的工具也非常多,见下面的列表

技术图片

 

 Funrich 也可以做功能富集分析

以上的工具中,DAVID最为常用也最为权威。DAVID是由美国Leidos生物医学研究公司的LHRI团队开发的一个在线基因注释及功能富集网站(https://david.ncifcrf.gov/)

使用DAVID做功能富集分析

 

以上是关于单细胞之富集分析-3:GO和KEGG富集分析及绘图的主要内容,如果未能解决你的问题,请参考以下文章

非模式生物GO、KEGG富集分析

GO、KEGG富集分析(一)有参情况

GO和KEGG富集倍数(Fold Enrichment)如何计算

GO/KEGG功能富集分析及气泡图

GO,KEGG,DO 富集分析

一些GO及KEGG分析的知识