使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)
Posted 橙子牛奶糖
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)相关的知识,希望对你有一定的参考价值。
1、下载安装bedtools;
2、生成bed文件;标准的bed文件格式如下:
chr7 127471196 127472363 Pos1 0 + 127471196 127472363 255,0,0
chr7 127472363 127473530 Pos2 0 + 127472363 127473530 255,0,0
chr7 127473530 127474697 Pos3 0 + 127473530 127474697 255,0,0
chr7 127474697 127475864 Pos4 0 + 127474697 127475864 255,0,0
如果你只有染色体、起始位置和终止位置信息的话,也无大碍。不大标准但是不伤大雅的bed文件格式如下:
chr7 127471196 127472363
chr7 127472363 127473530
chr7 127473530 127474697
chr7 127474697 127475864
3、提取多个位置的vcf文件;
bedtools intersect -a myfile.vcf.gz -b mutil-region.bed -header > output.vcf
以上是关于使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)的主要内容,如果未能解决你的问题,请参考以下文章