欲练神功,必先得到VCF—变异信息提取(call SNP pipeline)1
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了欲练神功,必先得到VCF—变异信息提取(call SNP pipeline)1相关的知识,希望对你有一定的参考价值。
参考技术A 群体遗传大部分的分析大部分基于VCF文件,所以得到一个高质量的VCF文件很有必要。在此记录一下从重测序的fastq文件提取SNP,过滤VCF的一系列流程。
之前的做法还是一步一步慢慢来,但涉及到更多的个体数据就很麻烦,因此写了一个小小的sh脚本,也算是节约时间吧。
废话不多说,上sh~
call_snp.sh 每一个小步骤需要改的地方不多,内存和线程根据服务器配置和需求改就行
every_chr_gvcf.py (脚本小垃圾 凑活看 能用但难看)
用到的软件:
Samtools
bwa
fastp
gatk 强烈推荐v 4.0
bedtools
后续步骤,且听下回。
2022-06-08修改vcf文件样本名称,提取指定vcf样本
参考技术A 1.修改vcf样本名使用bcftools的 rehead指令
bcftools reheader -s sample.file old.vcf -o new.sample.vcf
-s 后面的为sample.file 指定要替换的样本名,内容如下
2.提取指定样本vcf文件
准备好样本ID文件,samplelist.txt,一个样本名一行,如下
bcftools view -S samplelist.txt old.vcf.gz -Ov > new.vcf
以上是关于欲练神功,必先得到VCF—变异信息提取(call SNP pipeline)1的主要内容,如果未能解决你的问题,请参考以下文章
使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)