samtools的用法简介
Posted 爬行的乌龟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了samtools的用法简介相关的知识,希望对你有一定的参考价值。
1.SAM(sequence Alignment/mapping)数据格式是目前高通量测序中存放比对数据的标准格式,当然他可以用于存放未比对的数据
2.AMTools的主要功能如下:
-
view: BAM-SAM/SAM-BAM 转换和提取部分比对
-
sort: 比对排序
-
merge: 聚合多个排序比对
-
index: 索引排序比对
-
faidx: 建立FASTA索引,提取部分序列
-
tview: 文本格式查看序列
-
pileup: 产生基于位置的结果和 consensus/indel calling
3.最常用的三板斧就是格式转换,排序,索引
转换:samtools view -S SRR3589912.sam -b > SRR3589912.bam(-S是最新版的samtools为了兼容以前的版本写的)
排序:samtools sort SRR3589912.bam -o SRR3589912_sorted.bam
索引:samtools index SRR3589912_sorted.bam
从上述可以看出了,比对后的sam文件应该先进行格式的转换,接着是排序,最后根据排序的文件建立索引文件。
4.samtools的排序方式有两种(常用)
默认方式,按照染色体的位置进行排序
samtools sort test.bam default
参数-n则是根据read名进行排序。
samtools sort -n test.bam sort_left
5.samtools的view不就可以进行格式转换,还可以进行数据的提取
例:提取1号染色体上1234~123456区域的以对read
samtools view SRR3589957_sorted.bam chr1:1234-123456 | head
参考网址:https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247484720&idx=1&sn=4bb3e3d2182ffe937d58dc135b4bbd24&chksm=9b48458bac3fcc9df23d7f84023eb371289d58a74a5237056c232cb23d6af6645516153d36e0&scene=21#wechat_redirect
以上是关于samtools的用法简介的主要内容,如果未能解决你的问题,请参考以下文章