WSL 一行命令 快速合并文件 Fasta Fas合并
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了WSL 一行命令 快速合并文件 Fasta Fas合并相关的知识,希望对你有一定的参考价值。
参考技术A 有需求将多个单个基因序列.fasta文件合并到一个多序列的.fasta文件里,方便后续的序列比对和进化分析或者
从文件大小可以看出合并成功
单基因序列fasta文件内容展示
多基因序列all.fasta 文件内容展示
如果没有WSL可以先安装WSL Linux子系统
教程参考
Win+Linux单系统解决方案——WSL(入门篇)
fastq格式,如何快速计算fasta, fastq的reads数?
参考技术A fastq格式是一种基于文本的存储生物序列和对应碱基或者氨基酸质量的文件格式,最初由桑格研究所( Wellcome Trust Sanger Institute )开发出来,现已成为存储高通量测序数据的事实标准。举个例子:
我们可以看到每一个序列有四行
第一行:必须以"@"开头,后面跟着序列的id信息,以及描述(测序通道,坐标,reads长度等)
第二行:序列
第三行:必须以"+"开头,后面跟着可选的ID标识符和可选的描述内容,但是内容必须和第一行保持一致
第四行:质量分数,对应到该测序仪器所采用的phred标准,对应ascall码范围求得整数质量分数值.
fasta格式比较常见,用于表示核苷酸序列或氨基酸序列。
第一行:必须以">"开头,后面接序列的id信息,然后是描述部分
第二行:序列信息,可以是核酸或者是氨基酸序列
根据以上的描述,我们知道知道fastq条数就是总行数/4,fasta条数就是数">"的个数
以上是关于WSL 一行命令 快速合并文件 Fasta Fas合并的主要内容,如果未能解决你的问题,请参考以下文章