bcftools常用命令总结

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了bcftools常用命令总结相关的知识,希望对你有一定的参考价值。

参考技术A

bcftools是一个用于检测突变和处理vcf(variant call format)、bcf(vcf对应的二进制形式)文件的工具。虽然bcftools的大部分命令都可以直接处理没有索引的bcf和vcf,但是个别命令需要建立索引。尤其当bcftools需要同时处理多个vcf时,任何命令都要求vcf文件为压缩形式并存在对应索引文件。

关于输入文件:

主要功能:添加注释信息;删除注释信息

call 是bcftools查找变异的工具,它取代了bcftools 之前的view caller

用于将多个VCF/BCF文件合并为1个。常常用来将多个染色体的vcf文件合为一个;或者将snp和indel两种不同突变类型的文件合并为1个。
注意:

同样用于合并vcf文件, merge 主要是将单个样本的VCF文件合并成一个多个样本的VCF文件。

注意:

该命令用于多个vcf文件之间取交集、差集、并集等操作。经典的应用场景是对多种软件的SNP calling 结果进行venn 分析。

用于统计vcf文件的基本信息,例如,突变个数、突变类型的个数、转换和颠换的个数、测序深度、INDEL长度等。同时,还可以用plot-vcfstats进行可视化处理。
如果该命令后面接了2个vcf文件,则会分别计算两个vcf文件的交集和补集(默认以position比较,倘若vcf文件内包含多个sample的突变信息,则需要通过 -s 或 -S 参数载入“样本名称”)。并判断两个vcf文件的一致性(突变基因对应频率的一致性、样本基因型的一致性、以及不一致的基因型)和关联性。

对bgzip压缩的bcf、vcf文件建立索引,默认索引格式为 csi (coordinate-sorted index),同时支持 tbi 索引

可以处理vcf和bcf文件(bcf文件为vcf文件的二进制形式),用来将vcf文件和bcf文件互相转换。也可以通过使用过滤参数或限制位置区间提取文件信息。
下面介绍几个过滤参数:
(注意⚠️: 取子集的参数 过滤参数 尽可能不要出现在同一个命令行)

输出指定格式的vcf和bcf文件

按照染色体位置对vcf文件排序

编辑VCF/BCF文件的头部或替换VCF文件中的样本名

待更新ing....

bcftools合并vcf文件

见命令:

bcftools merge A.vcf.gz B.vcf.gz C.vcf.gz -Oz -o ABC.vcf.gz

  参考链接:http://vcftools.sourceforge.net/htslib.html#merge

以上是关于bcftools常用命令总结的主要内容,如果未能解决你的问题,请参考以下文章

FastDFS常用命令总结

k8s 常用命令总结

es 常用命令总结

git常用命令总结 git常用命令总结

Linux常用命令总结

Kafka常用命令行总结