5. GWAS:群体结构——Admixture

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了5. GWAS:群体结构——Admixture相关的知识,希望对你有一定的参考价值。

参考技术A 随着技术的发展,Structure速度较慢,无法满足大量分子标记计算的需求,因此,admixture逐渐成为群体结构分析的主流软件。本文将介绍如何通过admixture进行群体结构计算。

http://dalexander.github.io/admixture/index.html

在plink中将vcf文件转换成admixture所需的.ped或.bed格式,这里以.ped为例

--vcf 输入文件名
--allow-extra-chr 允许其他格式染色体,如scaffold
--recode12 二进制编码
--out 输出文件名
--autosome-num 设置染色体数目,默认人类染色体数

每个K值都会生成两个文件,.P和.Q
P:储存推断的祖先种群的等位基因频率
Q:每个样本中各个祖先种群所占的百分比。

查看cv值,K=3时,cv error最小,最佳分群为3。

将CV结果复制粘贴至Excel中,绘制折线图。图中可看出最佳分群数为K=3。

提供几个我喜欢的配色:
K=3 "#FF4500","#9ACD32","#6495ED"
K=4 "#336666","darkred","steelblue","#CC9933"
K=5 "#FF4500","#5F7A61","#6495ED","#986D8E","#F6D167"

将K=3时的.Q文件拷贝至Windows中

当确定最佳分群数是3时,打开K=3时的.Q文件,文件共包含三列,每行为一个样本,三列中哪一个数值最大,则这个样本属于哪一个亚群。

以上是关于5. GWAS:群体结构——Admixture的主要内容,如果未能解决你的问题,请参考以下文章

一行命令学会全基因组关联分析(GWAS)的meta分析

群体结构图形三剑客——PCA图

GWAS基因芯片数据预处理:质量控制(quality control)

使用tassel和haploview进行GWAS

全基因组关联分析GWAS专题2——连锁不平衡

全基因组关联分析(GWAS):为何我的QQ图那么飘