2022你还在用fastqc?超高速fastq前处理工具教程

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2022你还在用fastqc?超高速fastq前处理工具教程相关的知识,希望对你有一定的参考价值。

参考技术A

拿到NGS全基因组下机序列以后肯定是Fastqc+Cutadapt+Trimmomatic去引物序列,匹配序列对原数据进行一波操作猛如虎的过滤。然而这个需要多次读取和写出数据,生产效率很低。所以在此推荐一款集成这三款工具功能于一体的更加智能化的工具fastp。
fastp不仅可以自动识别fastq数据里的引物,匹配序列,还能自动识别数据是single end还是pair end支持长/短read序列。常用测序平台的引物和匹配序列fastp都会自动识别不需要手动指定。并且还能自动识别读序错误进行删除。计算效率是fastqc的2~5倍。

引用一下原文:

可以git获取,也可以conda安装。

默认的功能里面包含了Quality filtering、Length filtering、Low complexity filter、Adapter trimming。

也可以是pair end。同时输出html和json格式的结果报告。剪掉tail末端的一个序列。删除20bp以下的序列,CPU16线程。

运行完成以后你可以看到结果的报告。

操作非常简单,妈妈再也不用担心我不会fastq前处理了。

引用

fastp: an ultra-fast all-in-one FASTQ preprocessor
Shifu Chen, Yanqing Zhou, Yaru Chen, Jia Gu
Bioinformatics , Volume 34, Issue 17, 1 September 2018, Pages i884–i890,

fastp: an ultra-fast all-in-one FASTQ preprocessor
Shifu Chen1,2,*, Yanqing Zhou1, Yaru Chen1, Jia Gu
bioRxiv preprint first posted online Mar. 1, 2018;
doi: http://dx.doi.org/10.1101/274100.

PDF
https://www.biorxiv.org/content/biorxiv/early/2018/03/01/274100.full.pdf

以上是关于2022你还在用fastqc?超高速fastq前处理工具教程的主要内容,如果未能解决你的问题,请参考以下文章

二代测序的数据的分析——质量控制

2022妈妈杯移动通信网络站址规划和区域聚类问题D题思路导读,你还在用kmeans?

在Linux系统中使用Shell实现多线程运行任务(多任务并发执行) 2022-05-30

五年了,你还在用junit4吗?

都 2021 年了,你还在用 Jenkins ?赶快看看这些替代方案吧!

拜托!你还在用 ! = null 判空?