关于单倍型和Phasing

Posted Bioinfarmer

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于单倍型和Phasing相关的知识,希望对你有一定的参考价值。

单倍型,即单倍体基因型,概念很好理解。

关于单倍型和Phasing_微信公众号

单倍型分型的过程就称之Phasing,定相或基因分型。

Phasing的意义,在人类疾病遗传和动植物群体遗传中非常重要。也是imputation的必经过程。

vcf文件中,​​./.​​​和​​.|.​​分别表示未定相和已定相。

Phasing的方法:

  • 家系定相,最准确,一般根据一家三口(Trio样本)推断,直接简单;
  • LD定相,最常用,根据群体LD block和统计模型,计算量大,只对高频突变(如>5%);
  • 物理定相,仅依赖测序数据,通过reads(来自同一单倍体)拼接,高深度测序能实现完全定相。

定相和填补同步进行,常用软件:

  • shapeit,beagle(人类居多)
  • impute2
  • Tassel(玉米)
  • Falcon-unzip(三代)

对于PacBio HiFi的二倍体数据,可直接用IPA,hifiasm或HiCanu等组装软件完成定相。

更详细的解释可参考:
​​​人类基因组的Phasing原理是什么?​


​https://www.dxy.cn/bbs/newweb/pc/post/1788966​



作者:​​Bioinfarmer​​​。若要及时了解动态信息,请关注同名微信公众号:Bioinfarmer。

以上是关于关于单倍型和Phasing的主要内容,如果未能解决你的问题,请参考以下文章

sh 推测单倍型用于局部血统分析

HaploView使用-OutofMemory

全基因组关联分析GWAS专题2——连锁不平衡

群体遗传分析—LD连锁不平衡

汇编_除法(被除数单倍或两倍字长)

关于人参考基因组的一些总结