SAM文件格式介绍

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SAM文件格式介绍相关的知识,希望对你有一定的参考价值。

参考技术A SAM 是sequence alignment format [ http://samtools.github.io/hts-specs/SAMv1.pdf] 的缩写, BAM文件是SAM的二进制文件 。当测序生成的fastq文件 比对到参考基因组 后就会生成SAM文件或者BAM文件。大部分的数据分析都是始于SAM文件。

SAM格式文件包括 头部注释部分 和 比对结果部分 ,头部分为''可选部分''。头部分位于比对部分之前, 以“@”开头 。比对部分有 11列是固定 的,其他多列可选。看如下例子:

比对结果部分每行标示一个read与参考序列的比对信息,前11列为必须字段,顺序固定。其余列是可选字段。前11列如下解释:

使用picard工具去重自己的sam/bam数据

目录

Building Picard

Running Tests

去重自己的sam/bam数据


picard是一组用于操作高通量测序 (HTS) 数据和格式的 Java 命令行工具。

Picard 是使用 HTSJDK Java 库HTSJDK实现的,以支持访问通常用于高通量测序数据的文件格式,例如SAMVCF

<

以上是关于SAM文件格式介绍的主要内容,如果未能解决你的问题,请参考以下文章

sam文件格式说明

sam格式的简单了解

Edit Distance编辑距离(NM tag)- sam/bam格式解读进阶

SAM/BAM 格式文件内容解析

sam文件解读

17SAM文件格式说明(转载迷宫中的将军)