欲练神功,必先得到VCF—变异信息提取(call SNP pipeline)1

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了欲练神功,必先得到VCF—变异信息提取(call SNP pipeline)1相关的知识,希望对你有一定的参考价值。

参考技术A

群体遗传大部分的分析大部分基于VCF文件,所以得到一个高质量的VCF文件很有必要。在此记录一下从重测序的fastq文件提取SNP,过滤VCF的一系列流程。
之前的做法还是一步一步慢慢来,但涉及到更多的个体数据就很麻烦,因此写了一个小小的sh脚本,也算是节约时间吧。
废话不多说,上sh~
call_snp.sh 每一个小步骤需要改的地方不多,内存和线程根据服务器配置和需求改就行

every_chr_gvcf.py (脚本小垃圾 凑活看 能用但难看)

用到的软件:

Samtools

bwa

fastp

gatk 强烈推荐v 4.0

bedtools

后续步骤,且听下回。

2022-06-08修改vcf文件样本名称,提取指定vcf样本

参考技术A 1.修改vcf样本名

使用bcftools的 rehead指令

bcftools reheader -s sample.file old.vcf -o new.sample.vcf

-s 后面的为sample.file 指定要替换的样本名,内容如下

2.提取指定样本vcf文件

准备好样本ID文件,samplelist.txt,一个样本名一行,如下

bcftools view -S samplelist.txt  old.vcf.gz -Ov > new.vcf

以上是关于欲练神功,必先得到VCF—变异信息提取(call SNP pipeline)1的主要内容,如果未能解决你的问题,请参考以下文章

使用bedtools提取vcf多个位置的变异(extract multi-region of genotypes by bedtools)

bcftools常用命令总结

vcf格式简介

VCF文件详细信息

生物数据格式 - vcf/bcf

欲练JS,必先攻CSS——前端修行之路