使用DBG2OLC对二三代数据进行基因组混装

Posted bio-mary

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用DBG2OLC对二三代数据进行基因组混装相关的知识,希望对你有一定的参考价值。

使用DBG2OLC软件利用二代和三代数据混合的基因组组装:

使用DBG2OLC找Contigs序列和Pacbio reads的Overlap并进行Layout

DBG2OLC通过比较contigs和Pacbio reads之间的overlap,将contigs序列定位到Pacbio reads上,将DBG的contigs结果运用到OLC算法中。

 

主要参数:
LD 
  是否载入compressed reads information。第一次运行DBG2OLC命令的时候,该参数的值必须是0;若为了得到更好的结果,则需要调整其它参数;调整这些参数的时候,设置该参数为1来跳过这个步骤,从而节约很多时间。
k 
  设置k-mer大小。k-mer用来比较contig和pacbio read之间的重叠,而不是用于基因组组装,推荐设置为 17 即可。

KmerCovTh 
  若contig和pacbio read之间匹配k-mers的覆盖度 < KmerCovTh,则认为contig和pacbio read没有重叠。推荐设置为2-10。
MinOverlap 
两条Pacbio read之间匹配的k-mers数目 < MinOverlap,则认为它们之间没有重叠。推荐设置为10-150。

AdaptiveTh 
  若contig和pacbio read之间匹配的k-mers数目 < AdaptiveTh * contig长度,则认为contig和pacbio read没有重叠。推荐设置为0.001-0.02。

RemoveChimera 去除嵌合体Pacbio reads。若Pacbio数据覆盖度大于10x,推荐设置该参数为 1 。

参考来源:
http://www.chenlianfu.com/?p=2436

以上是关于使用DBG2OLC对二三代数据进行基因组混装的主要内容,如果未能解决你的问题,请参考以下文章

三代组装小基因组研究综述

三代组装小基因组研究综述

使用BRAKER2进行基因组注释

三代测序组拼接组装工具Falcon

三代变异检测操作说明-DeepVariant

组装三代番木瓜基因组——by Serenity