[基因组工具]seqkit的使用

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[基因组工具]seqkit的使用相关的知识,希望对你有一定的参考价值。

参考技术A

SeqKit是一种跨平台的、极快的,全面的fasta/q处理工具。SeqKit为所有的主流操作系统提供了一种可执行的双元文件,包括Windows,Linux,Mac OS X,并且不依赖于任何的配置或预先配置就可以直接使用。

Sequence ID
大部分的软件,包括seqkit默认将主导的非空格字母作为ID。

对fastq文件进行一个概括浏览

在fasta/q文件中获取每条序列的GC含量

从fastq/a中根据名字和ID提取序列子集

从fasta/q序列中找到合并碱基并找到它的位置 (这个仿佛有点难度,不报错也不打印内容到屏幕)??

移去相同序列中重复的fasta/q记录

在fastq/a序列中定位motif/子序列/酶切位点

怎样通过长度来对大量的fasta文件进行排序

根据标题信息来拆分fasta序列

从一个text文件已知的字符串中搜索并替换fasta标题

从两个配对端读数的文件提取配对的reads

将两个fasta文件连接成一个

以上是关于[基因组工具]seqkit的使用的主要内容,如果未能解决你的问题,请参考以下文章

FASTA/Q序列处理神器---seqkit

统计fasta序列条数

单细胞RNA-seq比对定量用什么工具好?使用哪个版本的基因组?数据来说话

单细胞RNA-seq比对定量用什么工具好?使用哪个版本的基因组?数据来说话

泛基因组工具: Roary, panX, PEPPAN, PGAP

RNA-Seq基因组比对工具HISAT2