使用mafft进行多序列比对

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用mafft进行多序列比对相关的知识,希望对你有一定的参考价值。

参考技术A

多序列比对(多序列联配,Multiple sequence alignment, MSA) 是指把多条(3 条或以上)有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对,尽可能地把相同的碱基或氨基酸残基排在同一列上。这样做的意义是,对齐的碱基或氨基酸残基在进化上是同源的,即来自共同祖先(common ancestor)。

多序列比对的软件有很多,最常用的多的序列比对软件是 clustalw 。 有文献报道:比对速度(Muscle>MAFFT>ClustalW>T-Coffee),比对准确性(MAFFT>Muscle>T-Coffee>ClustalW)。因此,推荐使用 MAFFT 软件进行多序列比对。

使用了之前注释的水稻基因组数据,将其转换成蛋白质文件,

使用conda安装mafft,输入mafft,显示版本信息

按照软件要求输入信息,

成功运行

How to alignment by MAFFT

MAFFT比对快速且准确,常用做序列之间比对。

MAFFT官方下载地址

https://mafft.cbrc.jp/alignment/software/

下载适合自己电脑的MAFFT版本,打开mafft.bat,操作界面如下:

 技术图片

将需要比对的FASTA格式的文件(以filename.fas为例)放入MAFFT根目录文件夹(我的是mafft-win)中,在@后输入文件名filename.fas,如下:

 技术图片

回车,输入 输出的文件名(这里命名为filename1.fas),如下:

 技术图片

回车,输入4(设置输出文件格式为Fasta format),如下:

 技术图片

回车,输入1(一般设置alignment策略为自动),如下:

 技术图片

回车。接着设置附加参数,但是一般不设置附加参数,可直接再回车,如下:

 技术图片

 

 技术图片

输入Y后,回车,开始比对。中途若停止,按住Enter键,直至比对完。比对完的文件也保存于根目录中。

 技术图片

 

 技术图片

 

 技术图片

以上是关于使用mafft进行多序列比对的主要内容,如果未能解决你的问题,请参考以下文章

How to alignment by MAFFT

病毒进化树构建

如何进行序列比对?如何进行序列拼接

多序列比对并建树-ClustalW

如何用MEGA7做序列比对?

多序列比对