5. GWAS:群体结构——Admixture
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了5. GWAS:群体结构——Admixture相关的知识,希望对你有一定的参考价值。
参考技术A 随着技术的发展,Structure速度较慢,无法满足大量分子标记计算的需求,因此,admixture逐渐成为群体结构分析的主流软件。本文将介绍如何通过admixture进行群体结构计算。http://dalexander.github.io/admixture/index.html
在plink中将vcf文件转换成admixture所需的.ped或.bed格式,这里以.ped为例
--vcf 输入文件名
--allow-extra-chr 允许其他格式染色体,如scaffold
--recode12 二进制编码
--out 输出文件名
--autosome-num 设置染色体数目,默认人类染色体数
每个K值都会生成两个文件,.P和.Q
P:储存推断的祖先种群的等位基因频率
Q:每个样本中各个祖先种群所占的百分比。
查看cv值,K=3时,cv error最小,最佳分群为3。
将CV结果复制粘贴至Excel中,绘制折线图。图中可看出最佳分群数为K=3。
提供几个我喜欢的配色:
K=3 "#FF4500","#9ACD32","#6495ED"
K=4 "#336666","darkred","steelblue","#CC9933"
K=5 "#FF4500","#5F7A61","#6495ED","#986D8E","#F6D167"
将K=3时的.Q文件拷贝至Windows中
当确定最佳分群数是3时,打开K=3时的.Q文件,文件共包含三列,每行为一个样本,三列中哪一个数值最大,则这个样本属于哪一个亚群。
以上是关于5. GWAS:群体结构——Admixture的主要内容,如果未能解决你的问题,请参考以下文章