2018-10-25 GWAS实战(一) qqman绘制曼哈顿图

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2018-10-25 GWAS实战(一) qqman绘制曼哈顿图相关的知识,希望对你有一定的参考价值。

参考技术A 作为一个统计遗传学实验室里的学生,怎么可以不会GWAS分析,虽然学的是生物信息学,但是每天听师兄师姐在那里讨论这个模型,那个矩阵啥的,多多少少有点印象,虽然不会推导公式吧,用用软件总应该学会,所以我决定考试学习GWAS分析。

这个过程我要倒着来,假如说我已经拿到了每个snp位点的P值,下一步就是画曼哈顿图,还记得第一次看到曼哈顿图,感觉很是高大上。 后来师弟和我说,只要一个包就可以画出来,这个R包就是qqman.

第一步,在R中安装qqman这个R包:

第二步,查看学习手册

基本自学能力强的人看这个学习手册就能学会,这个包还是不难的

建议这个学习步骤走一遍,就会了

第三步,仿照脚本,看里面的注释内容自己理解

脚本里面记录我觉得比较重要的几条命令

我这里来详细介绍一个
如果我们啥也不设置,我感觉图片有点难看的

我们来加点彩色的

但是似乎这个颜色有点丑哇,所以建议使用我师弟给我的参数

然后我标记一下最高点

好啦,差不多啦,功能够用就行了,如果要再个性化,建议看一个这个R包的源码

注: R里面千万不要加入中文的逗号,不然程序运行有问题,你还发现不了

GWAS文献基于GWAS与群体进化分析挖掘大豆相关基因

Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean
中文名:基于GWAS与群体进化分析挖掘大豆驯化及改良相关基因



发表期刊杂志:nature biotechnology
影响因子:41.514
发表时间:2015年2月
发表单位:中科院遗传与发育生物学研究所
 

一、      研究取材
62株野生大豆、130株地方种和110个驯化品种构建的一个自然群体

二、      方法流程
Illumina HiSeq 2000 测序平台,测序文库300bp,样本平均测序深度达到11X

三、      生物信息学分析
群体结构分析、选择清除分析、重要性状的全基因组关联分析

四、      研究结果
1)使用BWA软件将原始数据与参考基因组进行比对,使用samtools将sam格式转化为bam,使用picard软件去掉Duplicated reads。

2)SNP calling使用GATK和samtools,取两者结果的交集。对于GATK参数设置:-stand_call_conf 30。MAF设置为0.01。

3) Indel calling类似于SNP calling,使用GATK的UnifiedGenotyper程序,起参数设置为-glm INDEL,只考虑6bp范围内的缺失和插入。

4)SNP注释使用的软件为ANNOVAR。SNP被注释到内含子(overlap- ping with an intron)、外显子、基因间区,可变剪切位点(within 2 bp of a splicing junction)、5′UTRs 、3′UTRs,, upstream and downstream regions (within a 1 kb region upstream or downstream from the transcription start site).注释在外显子区域的SNP又分为同义和非同义突变。注释到外显子的Indel又分为移码突变和非移码突变。

5)群体结构分析中,PCA使用的是EIGENSOFT 4.2 的smartpca 程序,neighbor-joining tree 使用PHYLIP 3.68软件。结构分层使用FRAPPE,其中k值选取2到7.连锁不平衡分析使用plink软件。关联分析使用的GAPIT 分析软件。
技术分享




























以上是关于2018-10-25 GWAS实战(一) qqman绘制曼哈顿图的主要内容,如果未能解决你的问题,请参考以下文章

还在做SNP-GWAS?来看看SV-GWAS吧!

GWAS基因芯片数据预处理:质量控制(quality control)

全基因组关联分析(GWAS)的计算原理

GWAS 分析常用文件格式总结

使用tassel和haploview进行GWAS

一行命令学会全基因组关联分析(GWAS)的meta分析