BOWTIE2 进行基因组比对

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BOWTIE2 进行基因组比对相关的知识,希望对你有一定的参考价值。

参考技术A

Bowtie 2是常用的基因组比对软件。其原理在此不过多赘述,有兴趣的同学可以参阅其 官方文档 以及其发表的文章( https://doi.org/10.1038/nmeth.1923 )。下面简单介绍Bowtie 2 Index和比对的命令及个人常用参数。

<reference_in>:如果此处使用 -f 参数,则指明index的参考fasta 文件;如果使用 -c 参数,则指明index的参考序列,例如, GGTCATCCT , ACGGGTCGT , CCGTTCTATGCGGCTTA .
<bt2_base>:指的是生成的index文件的前缀,默认情况, bowtie2-build 产生NAME.1.bt2, NAME.2.bt2, NAME.3.bt2, NAME.4.bt2, NAME.rev.1.bt2, and NAME.rev.2.bt2, where NAME is <bt2_base>.
--threads 使用的线程数

上述命令使用该fasta文件 /public/Reference/GRCh38.primary_assembly.genome.fa ,在当前位置产生前缀为 GRCh38 的index文件。

单端测序比对

-x :参考基因组index文件的前缀(包括路径)
-U :单端测序的fastq文件
-S :输出的SAM文件,包含比对结果
-p :使用的线程数
"2>Align.summary":将输出到屏幕的标准误(standard error)重导向到"Align.summary"文件,其格式通常如下

双端测序比对

双端比对模式基本与单端一致,只需替换fastq文件传入的参数即可
-1 :一链fastq文件
-2 :二链fastq文件

Bowtie2 还有更多详细的比对参数可以调整,这里就不一一介绍了。下面再介绍其输出的SAM文件中各列的含义。

SAM文件的每一行代表一个reads的比对情况,至少包含了12列(tab分割),从左往右,每一列的含义依次为:

以上就是对Bowtie 2进行基因组比对的一些总结,以后有新的心得再做补充。

完。

以上是关于BOWTIE2 进行基因组比对的主要内容,如果未能解决你的问题,请参考以下文章

tophat软件比对-实战(2018-05-29)

基于BWT算法的比对软件原理解析(BWA & Bowtie & Bowtie2)

使用RSEM进行转录组测序的差异表达分析

tophat的用法

使用Sentieon加速甲基化(WGBS)分析

RNA-seq中的基因表达量计算和表达差异分析