使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)

Posted 橙子牛奶糖

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)相关的知识,希望对你有一定的参考价值。

1、下载安装bedtools

2、生成bed文件;标准的bed文件格式如下:

chr7    127471196  127472363  Pos1  0  +  127471196  127472363  255,0,0
chr7    127472363  127473530  Pos2  0  +  127472363  127473530  255,0,0
chr7    127473530  127474697  Pos3  0  +  127473530  127474697  255,0,0
chr7    127474697  127475864  Pos4  0  +  127474697  127475864  255,0,0

如果你只有染色体、起始位置和终止位置信息的话,也无大碍。不大标准但是不伤大雅的bed文件格式如下:

chr7    127471196  127472363 
chr7    127472363  127473530  
chr7    127473530  127474697  
chr7    127474697  127475864  

3、提取多个位置的vcf文件;

bedtools intersect -a myfile.vcf.gz -b mutil-region.bed -header > output.vcf

 






以上是关于使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)的主要内容,如果未能解决你的问题,请参考以下文章

VCF文件详细信息

提取bam/sam文件指定区域reads

VCF变异统计及绘制染色体分布图

WGS全基因组分析VCFTOOLS使用

vcf格式简介

bcftools常用命令总结