ggtree实现系统发育树可视化

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ggtree实现系统发育树可视化相关的知识,希望对你有一定的参考价值。

参考技术A Newick是最常用的存储进化树的文件格式,如上面这个树,拓朴结构用newick格式可以表示为:

(B,(A,C,E),D);

括号最外层是根节点,它有三个子节点,B, (A,C,E)和D,而节点(A,C,E)也有三个子节点A,C和E。

加上分支长度,使用 : 来分隔:

(B:6.0,(A:5.0,C:3.0,E:4.0):5.0,D:11.0);

比如A:5.0代表的是A与其父节点的距离是5.0。

内部节点也可以有label,写在相应的括号外面,如下所示:

(B:6.0,(A:5.0,C:3.0,E:4.0)Ancestor1:5.0,D:11.0);

这是最为广泛支持的文件格式,很多进化树可视软件只支持newick格式。

假设有下面三种形式的进化树:

[1] (a, b, c);      无根树

[2] (a, b, c):1;  有根树

[3] ((a,b),c);      有根树

如果最外层大括号内只有两个分枝,即为有根树,如[3];

如果最外层大括号内有三个或以上分枝,一般为无根树,如[1];

但是,如果大括号外存在枝长参数,如[2]中的:1,这种情况认为三个分枝以一定的枝长连接到根上,为有根树

ggtree 只映射节点到坐标系统中,而线条在geom_tree图层中计算并画出来。这是与其它软件最根本的不同,也是ggtree能够简单地用图层加注释信息的基础。

if (!requireNamespace("BiocManager", quietly = TRUE))

    install.packages("BiocManager")

BiocManager::install("ggtree")

library("ggplot2")

library("ggtree")

tree=read.tree("D:/xxx.tre")

group_file = read.csv("D:/xx.csv",header = T, row.names =1) #读取物种group信息文件,注意要与载入的Tree文件的lable相同,否则无法加载分组颜色!

groupInfo <- split(row.names(group_file), group_file$family) # 提取分组信息

tree1 <- groupOTU(tree, groupInfo)  #将分组信息赋予给树

ggtree(tree, layout = "circular")

ggtree(tree, layout = "circular")  #简单

ggtree(tree,layout = "circular") + geom_tiplab() + geom_point(color='firebrick') #

ggtree(tree1,layout = "circular") +geom_highlight(node = 1872,fill="blue ",alpha=0.5)+  geom_highlight(node=1081,fill=" orange", alpha=0.5)+ geom_highlight(node=1079,fill=" red ")+ geom_cladelabel(node=1872,label="Pinopsida",offset=1.2,barsize = 4,color=" blue ")+geom_cladelabel(node=1081,label="Magnoliopsida",offset=1.2,barsize = 4,color=" orange",)+geom_cladelabel(node=1079,label="Ginkgoopsida",offset=1.2,barsize = 4,color="red")  #自定义

G Yu, DK Smith, H Zhu, Y Guan, TTY Lam*.ggtree: an R package for visualization and annotation of phylogenetic treeswith their covariates and other associated data. Methods in Ecology andEvolution. 2017, 8(1):28-36.

怎样判断newick格式的进化树是有根树,还是无根树?http://blog.sciencenet.cn/blog-656335-926722.html

神经系统发育总结

Human-Specific Genes, Cortical Progenitor Cells, and Microcephaly 灵长类,尤其是人类,SVZ区域相较其他类物种明显扩大,SVZ又可以在形态学上分为inner SVZ(iSVZ),outer SVZ(oSVZ),oSVZ扩大的面积最显著

以上是关于ggtree实现系统发育树可视化的主要内容,如果未能解决你的问题,请参考以下文章

用 ggtree 绘制 igraph 树对象

二叉树可视化 - 圆形树? (QT)

R语言实现生物序列的降维比对

Python中的树形图

分子进化与系统发育

基因家族分析(4)ggtree绘制高端进化树