BOWTIE2 进行基因组比对
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BOWTIE2 进行基因组比对相关的知识,希望对你有一定的参考价值。
参考技术ABowtie 2是常用的基因组比对软件。其原理在此不过多赘述,有兴趣的同学可以参阅其 官方文档 以及其发表的文章( https://doi.org/10.1038/nmeth.1923 )。下面简单介绍Bowtie 2 Index和比对的命令及个人常用参数。
<reference_in>:如果此处使用 -f 参数,则指明index的参考fasta 文件;如果使用 -c 参数,则指明index的参考序列,例如, GGTCATCCT , ACGGGTCGT , CCGTTCTATGCGGCTTA .
<bt2_base>:指的是生成的index文件的前缀,默认情况, bowtie2-build 产生NAME.1.bt2, NAME.2.bt2, NAME.3.bt2, NAME.4.bt2, NAME.rev.1.bt2, and NAME.rev.2.bt2, where NAME is <bt2_base>.
--threads 使用的线程数
上述命令使用该fasta文件 /public/Reference/GRCh38.primary_assembly.genome.fa ,在当前位置产生前缀为 GRCh38 的index文件。
单端测序比对
-x :参考基因组index文件的前缀(包括路径)
-U :单端测序的fastq文件
-S :输出的SAM文件,包含比对结果
-p :使用的线程数
"2>Align.summary":将输出到屏幕的标准误(standard error)重导向到"Align.summary"文件,其格式通常如下
双端测序比对
双端比对模式基本与单端一致,只需替换fastq文件传入的参数即可
-1 :一链fastq文件
-2 :二链fastq文件
Bowtie2 还有更多详细的比对参数可以调整,这里就不一一介绍了。下面再介绍其输出的SAM文件中各列的含义。
SAM文件的每一行代表一个reads的比对情况,至少包含了12列(tab分割),从左往右,每一列的含义依次为:
以上就是对Bowtie 2进行基因组比对的一些总结,以后有新的心得再做补充。
完。
以上是关于BOWTIE2 进行基因组比对的主要内容,如果未能解决你的问题,请参考以下文章