使用R语言将fasta转phylip格式
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用R语言将fasta转phylip格式相关的知识,希望对你有一定的参考价值。
参考技术A 使用paml软件里的mcmctree功能需要phylip格式的比对结果,找了以下,发现用R包phylotools转化最方便,另外提醒一下要用mcmctree的朋友,我发现mcmctree的序列名字长度不能超过50个字符,如果超出的话,建议先改名字再转化。先安装依赖的包(要先装BioConductor):
假设fasta文件名为: aligned_fasta.fasta 读取fasta文件,转化:
结果文件为out.phy
注意:生成out.phy里,第一列序列名和第二列序列只有一个空格,而mcmctree要求两个以上,所以需要人工加多一个空格.
也可以用shell命令生成:
R语言factor类型转numeric
R 语言中为了进行数据分析,比如回归分析,这时候对于数据表格中的factor类型的数据会带来弊端,比如对因子的每一个数据都进行一次回归,这样就显得很复杂,且违背了我们的初衷,需要把factor转换为numeric格式。
factor不能直接转换为numeric格式,它会按照因子的大小顺序依次取值1,2,3......
想要正确转换为对应的数值,可以先把factor转换为character格式,然后再转换为numeric,就可以正确显示数值
> data<- read.csv(‘breast_cancer.csv‘); > class(data$x6); # 这时候为factor [1] "factor" > # 然后转换factor为numeric > data$x6<-as.numeric(as.character(data$x6)); > class(data$x6); # 这时候为numeric [1] "numeric"
另外需要注意的是,如果你的数据中包含NA值或者其他错误类型的值,那么转换为character类型会产生报错,需要先删去所有错误类型的值,方法详见另一篇博客 https://www.cnblogs.com/zhaoke271828/p/12892718.html
------------------------------
ZKe
以上是关于使用R语言将fasta转phylip格式的主要内容,如果未能解决你的问题,请参考以下文章