GO富集结果整体可视化

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了GO富集结果整体可视化相关的知识,希望对你有一定的参考价值。

参考技术A   GO (Gene Ontology )是一个基因功能的国际标准分类体系。意在从分子功能 (Molecular Function)、生物过程 (Biological Process)、和细胞组成 (Cellular Component) 三个层面对基因和蛋白质功能进行限定和描述,建立一个适用于各种物种并能随着研究不断深入而更新的语言词汇标准。
  GO富集分析已经算是很常规的分析内容,可以很方便地将分析得到的基因集归类到不同的GO条目,从而让研究者可以轻松地得知这些基因都参与哪些生物过程。GO分析的操作这里就不再赘述了,网上有很多相关的帖子,基本上常规的物种用clusterProfiler包就可以解决了。今天我想来谈谈如何可视化GO分析的结果。对于GO富集结果的可视化,最常见的就是用条形图和气泡图来展示部分关注的条目。

  上面两种展现形式最为常见,可以很好地展示关注的条目。我们都知道有时候GO富集的条目会很多,如果想整体预览一下,有没有什么方法可以展示所有条目都涉及哪些功能呢?答案是肯定的。下面就来介绍一下simplifyEnrichment包是如何展示GO富集结果的。这里用该包中数据做一个演示。

结果如下图:

  结果看起来还是有点高大上的感觉,从图中可以看出496个GO条目根据条目名称的语意相似性被分成9个大类,每个大类右边有注释条,标明了每个类中涉及的条目关键字,有点类似词云的感觉。

  该包使用起来很简单,虽然不能准确的展示每个GO条目,但可以从整体上概览GO条目都涉及哪些方面,对于后续筛选还是很有帮助的。该包还有更为细节的用法,这里就不再赘述了,感兴趣的可以自己去摸索。按照惯例最后附上官方说明链接: Simplify Functional Enrichment Results 和 Word Cloud Annotation 。

R包 clusterProfiler: GO和KEGG富集结果显示基因symbol

参考技术A 注:1)MF和CC方法同BP,将BP改为MF,CC即可。
2)可视化中,showCategory为显示的item数,scale_y_discrete则调节label过长的情况,让图片看起来
更美观。
3)检查结果,可见geneID展示为gene symbol。

(1)在enrichGO函数中,设置readable = TRUE;
(2)用setReadable函数,对GO或者KEGG结果进行转化即可。

以上是关于GO富集结果整体可视化的主要内容,如果未能解决你的问题,请参考以下文章

R语言可视化之ggplot2——KEGG通路富集分析

R包 clusterProfiler: GO和KEGG富集结果显示基因symbol

转录组不求人系列(十三): GO、KEGG富集个性化作图

RclusterProfiler的GO/KEGG富集分析用法小结

R数据可视化7:气泡图 Bubble Plot

R语言GEO数据挖掘-功能富集分析