使用R语言将fasta转phylip格式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用R语言将fasta转phylip格式相关的知识,希望对你有一定的参考价值。

参考技术A 使用paml软件里的mcmctree功能需要phylip格式的比对结果,找了以下,发现用R包phylotools转化最方便,另外提醒一下要用mcmctree的朋友,我发现mcmctree的序列名字长度不能超过50个字符,如果超出的话,建议先改名字再转化。

先安装依赖的包(要先装BioConductor):

假设fasta文件名为: aligned_fasta.fasta 读取fasta文件,转化:

结果文件为out.phy
注意:生成out.phy里,第一列序列名和第二列序列只有一个空格,而mcmctree要求两个以上,所以需要人工加多一个空格.

也可以用shell命令生成:

R语言factor类型转numeric

  R 语言中为了进行数据分析,比如回归分析,这时候对于数据表格中的factor类型的数据会带来弊端,比如对因子的每一个数据都进行一次回归,这样就显得很复杂,且违背了我们的初衷,需要把factor转换为numeric格式。

  factor不能直接转换为numeric格式,它会按照因子的大小顺序依次取值1,2,3......

  想要正确转换为对应的数值,可以先把factor转换为character格式,然后再转换为numeric,就可以正确显示数值

 

> data<- read.csv(breast_cancer.csv);
> class(data$x6);  # 这时候为factor
[1] "factor"
> # 然后转换factor为numeric
> data$x6<-as.numeric(as.character(data$x6));
> class(data$x6);  # 这时候为numeric
[1] "numeric"

  另外需要注意的是,如果你的数据中包含NA值或者其他错误类型的值,那么转换为character类型会产生报错,需要先删去所有错误类型的值,方法详见另一篇博客  https://www.cnblogs.com/zhaoke271828/p/12892718.html

------------------------------

ZKe

以上是关于使用R语言将fasta转phylip格式的主要内容,如果未能解决你的问题,请参考以下文章

将多个样本的vcf文件转化为Phylip输入格式的python脚本

用C#语言将json格式数据转成json对象

R语言factor类型转numeric

R语言factor类型转numeric

r语言矩阵转为图表

如何将r语言中矩阵转成c 中数组