数量性状

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数量性状相关的知识,希望对你有一定的参考价值。

定义:具有连续变异的性状称为数量性状。

请问:什么叫连续变异?难以理解。

Thank you~

首先要明确,这里的“连续变异”并不是“变异”,也就是不属于变异类型。这里的“连续变异”指性状的连续性变化。例如,水稻种子的重量,可能有25克的,35克的,还有可能是介于25克到35克之间的任意数值,这样的变化就是所谓的“连续变异”,最好表述为“连续变化”。

性状可分为质量性状和数量性状两大类。
质量性状,是指具有明显的不连续差异的性状。例如:水稻的粳与糯,鸡羽的芦花斑纹和非芦花斑纹。
数量性状,是指变异呈连续状态,界限不清楚,不易分类的性状。例如:作物的产量、成熟期,奶牛的泌乳量,棉花的纤维长度、细度等等。

参考资料:刘祖洞《遗传学》(第二版) 第八章——数量性状的遗传

参考技术A 数量性状(quantitative
characters)是指在一个群体内的各个体间表现为连续变异的性状,如动植物的高度或长度等。数量性状较易受环境的影响,在一个群体内各个个体的差异一般呈连续的正态分布,难以在个体间明确地分组。
所有能够度量的性状都可成为数量性状。这些性状呈连续变异。这些性状呈连续变异,它不可以严格地分类,而是呈现出一系列程度上的差异,带有这些差异的个体没有质的差别,只有量的不同。数量性状包括
两大类:一是表现连续变异的性状,如牛的泌乳量、农作物的产量、棉花纤维、羊毛的长度等等;二是表型呈非连续变异,而遗传物质的数量呈潜在的连续变异的性状,即只有超越某一遗传阈值时才出现的性状,如动、植物甚至包括人类的抗病力、死亡率以及单胎动物的产仔数等性状,称为阈性状(threshold
character或
threshold
trait)无论是牛的泌乳量还是单胎动物的产仔数,无论是玉米的果穗长度还是动、植物的抗病力,它们大多数对人类具有重要的经济价值,因而直接关系到人类自身的经济利益和生活质量。
数量性状表型的连续性是下列两个现象的结果。第一,一种基因型并不只表达为一种表型,而是影响一组表型的表现。其结果模糊了基因型所决定的不同表型之间的差异,因而不能将一个特定的表型归属于一个特定的基因型。第二,许多不同基因座的等位基因都能使某一种被观察的表型发生改变。许多不同的基因型可能有相同的表现型。

eQTL | Expression quantitative trait loci | 表达数量性状基因座 | QTL | 数量性状位点

 

到底什么是eQTL?

eQTL和QTL之间有什么联系?为什么说QTL比eQTL难很多?

QTL和GWAS有什么关系?

GTEx数据库里的eQTL数据如何利用?

说eQTL之前必须先解释QTL,QTL,一说到中文名就清楚了,数量性状位点,就是一个性状,比如身高,会由成百上千个基因来决定,目的简单明确,那么我们如何找到这些位点呢?

Quantitative Trait Locus (QTL) Analysis - 来自nature的介绍

实现层面,其实研究的不是基因,而是染色体上的区段,更明确的说就是分子标记,SNP最流行,大学里还学过很多烦人的分子标记。

关联是关键,association,基本假设就是遗传片段会跟表型一起分离。

通常极少数的loci具有很高的effect size。

技术图片

选择足够纯的亲代(需要有基因型和表型的差异),然后不断杂交,后代的基因型和表型会不断的分离重组。

然后对基因组的每个位点做统计检验,得出likelihood ratio,从而得出初略的位点信息。

再最后用分子生物学的方法来narrow down有效区域。

想彻底理解背后的统计学思路还得好好啃几篇paper。

 

空说空看是不可能学扎实的,所以废话不多说,开始用R实操吧,在分析中你会理解越来越多的概念。

R/qtl: A QTL mapping environment

先装个包,然后library("qtl")

载入数据:data(hyper)

先看看genotype的数据:

行代表样品,也就是一个小鼠,列代表了marker,右边列出来的是marker在1号染色体上的位置cm。

0、1、2分别代表什么;0代表两个都是reference allele;1代表一个是reference allel、一个是alternative allele;2代表两个都是alternative allele。

这个要注意,由于真核大多都是非单倍体,所以通常都有2个或多个等位基因;但是参考基因组里只有一套等位基因,那个就是reference allel;如果要考虑多个等位基因,或者考虑haplotype则要做phasing。

技术图片技术图片

再看看phenotype的数据:

技术图片

可以看看油管的视频:Using R/qtl to analyze QTL data

可视化数据:

第一个图黑色代表缺失值,

技术图片

 

最终我们会得到什么结果呢?


听过飞哥对eQTL的解释,就是相当于把每个基因的表达数据当做是一个phenotype,然后做关联分析,看哪些snp对基因的表达产生影响。

If a given genotype affects (decreases or increases) gene expression at the same locus of the genotype, it‘s called cis eQTL, if it affects expression at a different locus, trans eQTL.

An eQTL is a locus that explains a fraction of the genetic variance of a gene expression phenotype. 

下图是一个典型的eQTL位点,它是在TSS两侧1M区间内,叫做cis-eQTL,下图可以看出三种基因型下表达有显著差异,表明该位点对基因表达有显著影响。

技术图片

通常我们的说法是这个gene有哪些eQTL位点,通常只需要100个个体就可以了。trans eQTLs要难找得多,因为算法上需要扫描整个基因组区域。

做遗传都知道,做什么都要先把population考虑进去。17 per cent of genes were differentially expressed between populations。GxE互作也是老生常谈。

population minor allele frequency

为什么eQTL必须分组织来分析,因为gene expression signatures are cell-type specific。

cis eQTLs are cell-type specific,所以以上的话需要修正为“这个gene在这个组织里有哪些eQTL位点”。

这就表明某些snp只会影响某些特定的组织,以及致病。

These observations certify the importance of integrating data from a relevant tissue when trying to interpret GWAS results using gene expression as an intermediate phenotype.

An important caveat is that in several cases the same regulatory region and variant will be linked to one gene in one tissue and another gene in another tissue

Expression quantitative trait loci: present and future 

看下GTEx数据怎么利用,GTEx Portal: Introduction to the Gene eQTL Visualizer

Genotype-Tissue Expression - GTEx Portal官网 里面都是cis-eQTL

输入一个基因后,会有一个主表出现,相当于heatmap,行是组织,列是eQTL,里面点的颜色代表NES,The size and color of the bubble represent the p-value and NES (normalized effect size) of the eQTL。

拖动上面的框到中间就会看到TSS和TES,底下的被蓝色框起来的灰色框代表了exon区域。

技术图片

附图就是每个eQTL之间的LD score,黑色代表这些eQTL间并不是独立的,更趋向于连锁在一起。

 

技术图片

点击某个eQTL就能看到具体的表达差异了。

技术图片

 


 

一篇通俗的文章:eQTL

Expression quantitative trait loci (eQTLs) are genomic loci that explain all or a fraction of variation in expression levels of mRNAs.

基因组位点,解释了基因表达的变化。

 

A quantitative trait locus (QTL) is a section of DNA (the locus) which correlates with variation in a phenotype (the quantitative trait).

身高,连续性状的控制位点。

 

QTL是数量性状位点,比如身高是一个数量性状,其对应的控制基因的位点就是一个数量性状位点,而eQTL就是控制数量性状表达位点,即能控制数量性状基因(如身高基因)表达水平高低的那些基因的位点。

都是位点,一个是常规数量性状,如身高;另一个就是基因表达性状,如Sox10基因的表达;都是在找一些与其具有强烈相关性的(snp)位点。

QTL定位的核心就是连锁。

 

以上是关于数量性状的主要内容,如果未能解决你的问题,请参考以下文章

多基因假说的数量性状遗传

eQTL

根据性状间是不是呈现连续性变异还是不连续性变异可以将生物的形状划分为。

eQTL | Expression quantitative trait loci | 表达数量性状基因座 | QTL | 数量性状位点

多基因遗传简介

Spark UDF 函数怎么实现参数数量变化?