关联分析简要介绍

Posted 苑黎

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关联分析简要介绍相关的知识,希望对你有一定的参考价值。

关联分析 

概念:

 关联分析该方法是以长期重组后保留下来的基因(位点)间连锁不平衡(LD)为基础,在获得群体表型数据和基因型数据之后,采用统计方法检测遗传多态性和性状可遗传变异之间的关联,目标是寻找性状变异的基因组功能型变异(基因位点和标记位点)          

 关联分析是基于无亲缘关系的病例组和对照组在某一个遗传位点上会出现不同频率而设计的。

关联分析的基础----连锁不平衡

某一群体,不同基因座的的两个基因同时遗传的频率高于预期随机频率的现象。

当位于某一座位上的某个特定基因与另一个座位上的某个基因同时遗传的概率大于群体中因随机分布两个等位基因同时出现的的概率时,就称这两个基因座处于连锁不平衡状态。

例如两个相邻的基因A B, 他们各自的等位基因为a b. 假设A B相互独立遗传,则后代群体中观察得到的单倍体基因型 AB 中出现的P(AB)的概率为 P(A) * P(B).
实际观察得到群体中单倍体基因型 AB 同时出现的概率为P(AB)。 若这两对等位基因是非随机结合的,则P(AB)≠P(A)*P(B)。计算这种不平衡程度的方法为: D = P(AB)- P(A) * P(B).
连锁不平衡分析在连锁不平衡程度的评估、复杂疾病精细定位以及研究人类的历史和迁移中得到了越来越广泛的应用。连锁不平衡又称等位基因关联(allelic association),其原理其实很简单。
假定两个紧密连锁的位点1,2,各有两个等位型(A,a;B,b),那么在同一条染色体上将有四种可能的组合方式:A—B,A—b,a—B,和a—b。
假定等位型A的频率为Pa,B的频率为Pb,那么如果不存在连锁不平衡(如组成单倍型的等位型间相互独立,随机组合)单倍型A—B的频率就应为PaPb。而如果A与B是相关联的,单倍型A—B的频率则应为PaPb+D,D是表示两位点间LD程度的值

 

疾病与标记相关联的有两种情况:

一,治病基因与标记有很强的连锁不平衡关系。

二,遗传标记本身与遗传标记有关

 

上位性

一对基因的显性基因的表观受另一对非等位基因的作用,这种非等位基因的抑制或遮掩作用,叫上位性效应。起抑制作用的基因叫上位基因,被抑制的基因叫下位基因

 

以上是关于关联分析简要介绍的主要内容,如果未能解决你的问题,请参考以下文章

使用Apriori进行关联分析

9.2 GWAS:关联分析——TASSEL(GLM/MLM/CMLM)

微软AIOps工作:时序数据与事件的关联分析

Python --深入浅出Apriori关联分析算法 Apriori关联规则实战

关联算法

Python中的Apriori关联算法-市场购物篮分析