欲练神功，必先得到VCF—变异信息提取（call SNP pipeline）1

Posted 2023-04-23

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了欲练神功，必先得到VCF—变异信息提取（call SNP pipeline）1相关的知识，希望对你有一定的参考价值。

参考技术A

群体遗传大部分的分析大部分基于VCF文件，所以得到一个高质量的VCF文件很有必要。在此记录一下从重测序的fastq文件提取SNP，过滤VCF的一系列流程。
之前的做法还是一步一步慢慢来，但涉及到更多的个体数据就很麻烦，因此写了一个小小的sh脚本，也算是节约时间吧。
废话不多说，上sh~
call_snp.sh 每一个小步骤需要改的地方不多，内存和线程根据服务器配置和需求改就行

every_chr_gvcf.py (脚本小垃圾凑活看能用但难看)

用到的软件：

Samtools

bwa

fastp

gatk 强烈推荐v 4.0

bedtools

后续步骤，且听下回。

2022-06-08修改vcf文件样本名称，提取指定vcf样本

参考技术A 1.修改vcf样本名

使用bcftools的 rehead指令

bcftools reheader -s sample.file old.vcf -o new.sample.vcf

-s 后面的为sample.file 指定要替换的样本名，内容如下

2.提取指定样本vcf文件

准备好样本ID文件，samplelist.txt，一个样本名一行，如下

bcftools view -S samplelist.txt old.vcf.gz -Ov > new.vcf

以上是关于欲练神功，必先得到VCF—变异信息提取（call SNP pipeline）1的主要内容，如果未能解决你的问题，请参考以下文章

使用bedtools提取vcf多个位置的变异（extract multi-region of genotypes by bedtools）