R语言数据分析之ClusterProfiler

Posted 蛋白组学数据分析

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言数据分析之ClusterProfiler相关的知识,希望对你有一定的参考价值。

ClusterProfiler,该R包是由南方医科大学 余光创教授开发,版本也在不断更新,实现了 GO和KEGG等分析,同时可进行数据可视化。本文就主要分享一下GO和KEGG分析,以human为例( 其他物种的信息请参考最下方的参考资料),代码如下:
library(xlsx)library(ggplot2)library(stringr)library(clusterProfiler)library(org.Hs.eg.db)#根据分析的物种选择
setwd("D:/Rfiles/RLanguage/Clusterprofiler")
gene <- read.table("gene.txt",header=T,sep=" ")
#ID转换ID <- bitr(gene$Name, fromType="SYMBOL", toType="ENTREZID", OrgDb="org.Hs.eg.db")#OrgDb修改成相应的分析物种,后续类似
#GO分开进行富集BP <- enrichGO(ID$ENTREZID, "org.Hs.eg.db", keyType = "ENTREZID",ont = "BP",pvalueCutoff = 0.05,pAdjustMethod = "BH",qvalueCutoff = 0.1, readable=T)
MF <- enrichGO(ID$ENTREZID, "org.Hs.eg.db", keyType = "ENTREZID",ont = "MF",pvalueCutoff = 0.05,pAdjustMethod = "BH",qvalueCutoff = 0.1, readable=T)
CC <- enrichGO(ID$ENTREZID, "org.Hs.eg.db", keyType = "ENTREZID",ont = "CC",pvalueCutoff = 0.05,pAdjustMethod = "BH",qvalueCutoff = 0.1, readable=T)
#pathway分析ekk <- enrichKEGG(ID$ENTREZID, keyType = "kegg", organism = "hsa", pAdjustMethod = "BH", pvalueCutoff = 0.05, qvalueCutoff = 0.05, minGSSize = 2)
#geneID转gene Symboly <- setReadable(ekk, 'org.Hs.eg.db', keyType = "ENTREZID")#ekk根据情况改成BP、MF、CC,主要是看想要导出哪个结果
c(nrow(y))
write.xlsx(y, sheetName = "KEGG", file = "result.xlsx")#这里的KEGG根据情况改成BP、MF、CC
#柱形图与气泡图展示barplot(KEGG, showCategory = 15, title = "Enrichment Pathway")#title可修改成BP、MF、CC、Pathway# Save as PDF, 12*10 inches
dotplot(KEGG, showCategory = 15, title = "Enrichment Pathway")#title可修改成BP、MF、CC、Pathway# Save as PDF, 9*8 inches
  • 数据准备:
在excel中将差异数据形成一列,首行命名为Name,如图1所示,随后文件导出成txt格式( excel格式也可以,代码暂时没有去调整),将文件放在目录 "D:/Rfiles/RLanguage/Clusterprofiler"下。

图1 数据准备

运行代码 :ctrl+ENTER键。注意进行GO、KEGG分析时,需要改动相应的代码,上述代码中 #部分也进行了提示。
导出的结果包括Excel表格、气泡图和柱形图,目前R已经更新到4.0.2版本,注意R和R包的更新。

R语言数据分析之ClusterProfiler

R语言数据分析之ClusterProfiler



  • 往期生信分析导航:

下一篇文章分享STRING数据库得出的结果使用Cytoscape软件优化分析,本人周期性劳作,不定时更新,欢迎 评论区及公众号留言相互交流学习, 看完希望给个三连( 关注、转发、评论) 。



  • 参考资料:

南方医科大学余光创教授

http://portal.smu.edu.cn/jcyxy/info/1084/2203.htm

ClusterProfiler,该R包版本在不断更新,实现了GO和KEGG等分析,同时可进行数据可视化。

http://www.bioconductor.org/packages/release/bioc/html/clusterProfiler.html

Bioconductor上提供了以下19个物种的Org类型的包,包含了这些物种的GO注释信息

https://cloud.tencent.com/developer/article/1625246

以上是关于R语言数据分析之ClusterProfiler的主要内容,如果未能解决你的问题,请参考以下文章

R语言GEO数据挖掘-功能富集分析

GEO数据挖掘小尝试:(三)利用clusterProfiler进行富集分析

R包 clusterProfiler: GO和KEGG富集结果显示基因symbol

关于R语言的数据类型和数据结构的如何区分

【R语言】解决GO富集分析绘图,标签重叠问题

快捷查找KEGG里的通路和基因