易基因:全基因组CpG密度和DNA甲基化分析方法比较(MeDIPRRBS和WGBS)| 研究综述
Posted E-GENE
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了易基因:全基因组CpG密度和DNA甲基化分析方法比较(MeDIPRRBS和WGBS)| 研究综述相关的知识,希望对你有一定的参考价值。
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。
CpG密度(CpG density)与各种组织中的DNA甲基化相关。基因组按CpG密度分为:CpG岛(CpG island,CGI)、CpG岛上下游2kb以内的区域(CpG shore ,CpG岛岸)、CpG岛岸上下游2kb以内的区域(CpG shelve,CpG大陆架),一共5个区域,分别统计各区域的甲基化水平。
全基因组DNA甲基化分析是用于基因组表征和差异DNA甲基化分析的最常见表观遗传学过程之一。先前的全基因组分析表明,CpG密度是DNA甲基化方法中的一个重要变量。目前的研究旨在分析各种不同物种基因组中的CpG密度,并将其与各种DNA甲基化分析数据集进行关联分析。对人、大鼠、鸟类、鱼类的基因组中观察到类似的结果:90%以上的基因组区域属于低密度类别(1-3 CpG/100bp),小于10%的基因组区域属于高密度类别(>5 CpG/100bp)。甲基化DNA免疫沉淀(MeDIP)使用抗5-甲基胞嘧啶抗体免疫沉淀,然后进行下一代测序(MeDIP-Seq),MeDIP偏好<5 CpG/100bp的低CpG密度(对应>95%的基因组)。减少代表性重亚硫酸盐测序(RRBS)通常在≥3CpG/100bp的较高CpG密度区域中鉴定DMR(对应约20%的基因组)。全基因组重亚硫酸盐测序(WGBS)在通常大于10 CpG/100bp更高的CpG密度区域分析,且WGBS可鉴定≥2 CpG/100bp区域(约占基因组50%)。CpG密度是DNA甲基化分析中的关键变量,不同分子技术专注于不同的基因组区域,本文比较了MeDIP-Seq、RRBS、WGBS三种DNA甲基化分析方法。
比较方法
MeDIP-seq、RRBS、WGBS每种技术均从目标细胞类型或组织的DNA提取和纯化开始。
MeDIP-seq将DNA超声处理成几百个碱基对的短片段,产生单链DNA以实现有效的抗体结合,然后使用5-甲基胞嘧啶抗体结合包含甲基化CpG位点的片段。这些片段通常用结合抗体的磁珠分离,并用PCR扩增DNA后测序。PCR包括通用引物和索引引物以及条形码引物,以扩增所有DNA片段。MeDIP-seq的局限在于无法达到单碱基分辨率,不是高通量测序,不能鉴定单个CpG甲基化水平和高密度的CpG位点。
基于亚硫酸盐转化的RRBS和WGBS是可以达到单碱基分辨率的高通量DNA甲基化测序方法。
RRBS使用甲基化敏感的限制性内切酶消化,在高GC密度CpG位点将未甲基化的DNA酶切成片段。对这些片段进一步处理并选择大小并靶向启动子和CpG岛区域,所得片段进行亚硫酸盐转化,将未甲基化的胞嘧啶转化为尿嘧啶,同时保留未转化的甲基化胞嘧啶,随后对片段进行PCR扩增并测序。
WGBS对全基因组进行亚硫酸盐处理和分析,在亚硫酸盐转化之前不进行甲基化片段分离。对亚硫酸盐转化后的全基因组甲基化进行测序,并使用各种生物信息学方案,通常用于基因组表征。
比较结果
在人、大鼠、鱼(斑马鱼和钢头鳟鱼)和鸟类(鸡)基因组中研究了全基因组CpG密度分布。从NCBI或Ensembl获得参考基因组序列,初步分析1000bp窗口鉴定全基因组CpG密度。基因组主要由<3 CpG/100bp的CpG密度较低区域组成,小部分基因组位点的CpG密度较高。在所有不同物种的基因组中观察到类似结果。在<3 CpG/100 bp的基因组区域中,对应于97%的人基因组、98%的大鼠基因组、88%的斑马鱼基因组、93%的钢头鳟鱼基因组、94%的鸡基因组。基因组中很少有1kb区域>20CpG/100bp(人1,鸡8,其他0),存在一些>10CpG/100bp的CpG密度较高区域(即CpG岛)(约占基因组1%),但绝大多数密度<5CpG/100bp。在大鼠基因组中,48%的100bp基因组窗口没有CpG,但当使用1kb窗口时,基因组下降到5%。结果表明基因组主要为低CpG密度,在用于研究全基因组DNA甲基化的方法中需要考虑到这一点。
图1:全基因组CpG密度。对应于CpG/100 bp的全基因组1 kb区域数。
(a)人、(b)大鼠、(c)钢头鳟鱼、(d)斑马鱼、(e)鸡
MeDIP-seq分析
此前研究已证明MeDIP分析偏好基因组低密度CpG区域。在NCBI GEO下载每个物种基因组发布的可用MeDIP-Seq数据集,以鉴定获得数据的CpG密度分布。图2为不同物种MeDIP-seq数据的代表性实例,分析重点在于两个不同样品组比较以鉴定用于数据分析的差异DNA甲基化区域(DMR)。MeDIP-seq数据集的DMR CpG密度分析结果表明大部分DMR为0–3 CpG/100bp的CpG密度,主要密度为1 CpG/100 bp,这与代表性基因组中的主要密度相关。在不同物种样本之间观察到一些变化,斑马鱼DMR尤其显示出向稍高的1-4 CpG/100 bp的CpG密度转变,可能归因为精子和红细胞两种不同细胞类型。总之结果表明MeDIP-seq数据能有效分析低密度基因组CpG区域(<3 CpG/100 bp),其占不同物种的基因组90%以上。
图2:甲基化DNA免疫沉淀测序(MeDIP-Seq)
差异DNA甲基化区(DMRs)的百分比对应于每100bp的CpG位点数量。
(a)人类MeDIP研究1 DMR;(b)人类MeDIP研究2 DMR;(c)大鼠MeDIP研究1 DMR;(d)大鼠MeDIP研究1 DMR;(e)斑马鱼MeDIP研究1 DMR;(f)斑马鱼MeDIP研究1 DMR;(g)斑马鱼MeDIP研究2 DMR;(h)钢头鳟MeDIP研究1 DMR;(i)钢头鳟MeDIP研究1 DMR;(j)鸡MeDIP研究1 DMR;(k)鸡MeDIP研究2 DMR;(l)鸡MeDIP研究2 DMR。
RRBS分析
在几种不同物种中比较了用于DNA甲基化分析的RRBS方法,确定每个数据集的CpG/100bp密度(图3)。数据集分析结果表明在DMR CpG密度分布中显示出分裂:一些数据集显示在>10 CpG/100 bp 的RRBS DMR中,CpG密度向更高方向变化,而其他数据集则显示向中等CpG密度变化。图2(a-c)和图3(c)中>10 CpG/100 bp的 CpG密度主要为10-12 CpG/100 bp,但如果增加到1 kb,则>10 CpG中约2/3低于10 CpG/1 kb。除鱼类之外,只观察到1或2 CpG/100 bp密度可忽略检测。结果表明,与MeDIP分析相比,RRBS数据偏向更高密度的CpG区域(如≥3CpG/100bp)。有趣的是,钢头鳟鱼的数据集在两个不同实验室的相同样品上分别使用了MeDIP-Seq和RRBS方法(图2和图3),因此对相同样品的不同分析进一步证明了MeDIP对较低密度CpG的偏倚和RRBS对较高密度CpG的偏倚。
图3:不同物种的减少代表性亚硫酸盐测序(RRBS)
差异DNA甲基化区域(DMR)的百分比对应于每100bp的CpG位点数量
(a) 人类RRBS研究1 DMR;(b)人类RRBS研究1 DMR;(c)大鼠RRBS研究1 DMR;(d)大鼠RRBS研究1 DMR;(e)斑马鱼RRBS研究1 DMR;(f)斑马鱼RRBS研究1 DMR;(g)斑马鱼RRBS研究2 DMR;(h)斑马鱼RRBS研究2 DMR;(i)钢头鳟鱼RRBS研究1 DMR;(j)钢头鳟鱼RRBS研究1 DMR。
WGBS分析
在几个不同物种中比较了用于DNA甲基化的全基因组重亚硫酸盐(WGBS)分析方法,确定每个分析的DMR CpG/100bp密度(图4)。结果表明WGBS数据集的CpG密度与RRBS数据集CpG密度范围类似。在向更高CpG密度(2-5 CpG/100bp)发生微小变化的分析与>10 CpG/100 bp的CpG密度分析之间存在差异。除了鸡之外,1 CpG/100 bp DMR的检测最少。观察结果表明,WGBS数据靶向比MeDIP分析更高密度的CpG区域。
图4:不同物种的全基因组重亚硫酸盐(WGBS)分析
(a) 人类WGBS研究1 DMR;(b)大鼠WGBS研究1 DMR;(c)大鼠WGBS研究2 DMR;(d)斑马鱼WGBS研究1 DMR;(e)斑马鱼WGBS研究2 DMR;(f)鸡WGBS研究1 DMR。
图5:不同DNA甲基化分析方法的基因组百分比
(a) 每种方法的基因组百分比(1kb基因组窗口的百分比)与所有物种的平均值。总条形图表示MeDIP 0–5 CpG/100bp、WGBS≥2 CpG/100bp、RRBS≥3 CpG/100bp、CpG岛芯片阵列的基因组总百分比。空心条表示不同方法的reads比对限制百分比。
(b) MeDIP 0–5 CpG/100 bp、WGBS≥2 CpG/100 bp和RRBS≥3 CpG/100 bps的每种方法在不同物种的基因组百分比(插图图例)。
易基因科技提供全面的DNA甲基化研究整体解决方案。
参考文献:
Beck D, Ben Maamar M, Skinner MK. Genome-wide CpG density and DNA methylation analysis method (MeDIP, RRBS, and WGBS) comparisons. Epigenetics. 2022 May;17(5):518-530.
相关阅读:
甲基化测序技术及其在老年疾病和衰老模型中的应用
一、甲基化测序技术
1、12中DNA甲基化测序技术
1)什么是DNA的甲基化呢?
DNA甲基化是指针对DNA序列上的CpG岛,由甲基化转移酶将S腺苷甲硫氨酸的甲基转移给胞嘧啶。其中,5’甲基胞嘧啶(5mC) 的甲基化是一个非常重要的表观遗传学修饰事件,该事件能够调控基因活性,并影响着如细胞分化、转录调控和染色质重塑等生物学过程。
2)什么是DNA甲基化测序?
随着下一代测序技术(NGS)技术的发展,使我们能够从全基因组水平来分析5’甲基胞嘧啶及组蛋白修饰等事件,由此能够发现很多传统的基因组学研究所不能发现的东西。
3)DNA甲基化测序方法按原理可以分成三大类:
(a)重亚硫酸盐测序;
(b)基于限制性内切酶的测序;
(c)靶向富集甲基化位点测序;
(d)采用动力学原理来直接检测甲基化的胞嘧啶测序;
4)基于以上原理又有数种不同的测序方法,下面,介绍12种DNA甲基化测序的常用方法及参考文献:
(a)重亚硫酸盐测序
该方法可以从单个碱基水平分析基因组中甲基化的胞嘧啶。首先,利用重烟硫酸盐对基因组DNA进行处理,将未发生甲基化的胞嘧啶脱氨基变成尿嘧啶。而发生了甲基化的胞嘧啶未发生脱氨基,因而,可以基于此将经重亚硫酸盐处理的和未处理的测序样本进行比较来发现甲基化的位点。
【相关文献】Shotgun bisulphite sequencing of the Arabidopsis genome reveals DNA methylation patterning Highly integrated single-base resolution maps of the epigenome in Arabidopsis
(b)重亚硫酸盐处理后接头标记技术(PBAT)
为了避免重亚硫酸盐处理时模板的丢失,通常会在重亚硫酸盐处理后进行接头连接和随机引物的扩增。
【相关文献】Amplification-free whole-genome bisulfite sequencing by post-bisulfite adaptor tagging
(c)限制性内切酶-重亚硫酸盐靶向测序(RRBS)
该技术是指对基因组上CpG岛或CpG甲基化较密集的区域进行靶向测序。样本首先经几种限制酶进行消化处理,然后经重亚硫酸盐处理,最后再测序。这种方法可以发现单个核苷酸水平的甲基化。
【相关文献】Reduced representation bisulfite sequencing for comparative high-resolution DNA methylation analysis
(d)氧化-重亚硫酸盐测序(oxBS-Seq)
5’羟甲基胞嘧啶(5’hmC)是5’甲基胞嘧啶脱甲基成胞嘧啶过程的中间产物,重亚硫酸盐测序无法对二者进行区分。通过氧化-重亚硫酸盐测序,5’甲基胞嘧啶保留,而5’羟甲基胞嘧啶(5’hmC)被氧化,进而脱氨基成尿嘧啶。通过将经过氧化处理和未处理的样本进行测序比较,即可从单个碱基水平分辨5’羟甲基胞嘧啶(5’hmC)和5’甲基胞嘧啶。
【相关文献】Quantitative sequencing of 5-methylcytosine and 5-hydroxymethylcytosine at single-base resolution
(c)TET辅助的重亚硫酸盐测序(TAB-seq)
TAB-seq采用葡萄糖亚胺与5’羟甲基胞嘧啶(5’hmC)作用来保护免受TET蛋白的氧化。5’甲基胞嘧啶和未甲基化的胞嘧啶被脱氨基成尿嘧啶,进而可以从单个碱基水平鉴定5’羟甲基胞嘧啶(5’hmC)。
【相关文献】Base-resolution analysis of 5-hydroxymethylcytosine in the Mammalian genome
(e)甲基化敏感性的限制酶测序(MRE-Seq)
MRE-Seq将甲基化作用的敏感性和限制酶的特异性结合起来进而鉴定CpG岛的甲基化状态。
【相关文献】Genome-scale DNA methylation analysis
(f)HELP-Seq
HELP-Seq采用HpaII及其甲基化不敏感的限制性内切酶MSPI处理,来对基因组内及基因组间的甲基化位点进行比较,进而实现甲基化测序。
【相关文献】Comparative isoschizomer profiling of cytosine methylation: the HELP assay
(g)甲基化DNA免疫共沉淀测序(MeDIP)
MeDIP是一种采用抗体或甲基化DNA结合蛋白来捕获富集甲基化DNA的技术,这种技术可以发现基因组中高度甲基化的区域,如CpG岛,但不能进行单个碱基水平的分析。
【相关文献】Chromosome-wide and promoter-specific analyses identify sites of differential DNA methylation in normal and transformed human cells
(h)羟甲基化DNA免疫共沉淀测序(hMeDIP)
(i)j甲基化DNA染色质免疫共沉淀测序(ChIP)
(g)甲基化结合域捕获技术(MBD-CAP)
MBD-CAP技术利用甲基化DNA能够结合蛋白MeCP2, MBD1-2 和 MBD3LI来对甲基化的DNA进行免疫沉淀。与MeDIP技术相似,该技术也是可以发现基因组中高度甲基化的区域,不能从单个碱基水平分析甲基化。
【相关文献】High-resolution mapping of DNA hypermethylation and hypomethylation in lung cancer
(k)基于探针的靶向富集技术
甲基化测序靶向富集技术采用合成寡核苷酸探针来捕获CpG岛、基因启动子区域以及其他一些显著性甲基化的区域。目前,Agilent 和 Roche Nimblegen公司已有这种商品化的试剂盒。
(l)单分子试实时(SMRT)DNA测序技术。
Pacific Biosciences公司的这项SMRT DNA测序技术采用动力学原理来直接检测甲基化的胞嘧啶。与上述提到的其他技术不同,这种技术不需要用到限制酶或重亚硫酸盐试剂。
2、RNA甲基化测序技术
3、组蛋白甲基化测序技术
4、转录因子甲基化测序技术
参考:http://www.biomart.cn/news/16/149588.htm
二、甲基化测序技术与老年疾病
1、老年糖尿病肾病患者转化生长因子β1基因表达调控区甲基化改变及机制;
参考:http://xueshu.baidu.com/s?wd=paperuri:(74db4ea8824f36bb38fa7c2e985cbb90)&filter=sc_long_sign&sc_ks_para=q%3D%E8%80%81%E5%B9%B4%E7%B3%96%E5%B0%BF%E7%97%85%E8%82%BE%E7%97%85%E6%82%A3%E8%80%85%E8%BD%AC%E5%8C%96%E7%94%9F%E9%95%BF%E5%9B%A0%E5%AD%90%CE%B21%E5%9F%BA%E5%9B%A0%E8%A1%A8%E8%BE%BE%E8%B0%83%E6%8E%A7%E5%8C%BA%E7%94%B2%E5%9F%BA%E5%8C%96%E6%94%B9%E5%8F%98%E5%8F%8A%E6%9C%BA%E5%88%B6&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_us=1774453518799272595
2、闽南地区住院患者脑白质疏松症的流行病学调查及基于DNA甲基化的静观遗传学研究
参考:http://xueshu.baidu.com/s?wd=paperuri%3A%28fc0336c3e0cb6ca6707aa058a1de306f%29&filter=sc_long_sign&sc_ks_para=q%3D%E9%97%BD%E5%8D%97%E5%9C%B0%E5%8C%BA%E4%BD%8F%E9%99%A2%E6%82%A3%E8%80%85%E8%84%91%E7%99%BD%E8%B4%A8%E7%96%8F%E6%9D%BE%E7%97%87%E7%9A%84%E6%B5%81%E8%A1%8C%E7%97%85%E5%AD%A6%E8%B0%83%E6%9F%A5%E5%8F%8A%E5%9F%BA%E4%BA%8EDNA%E7%94%B2%E5%9F%BA%E5%8C%96%E7%9A%84%E9%9D%99%E8%A7%82%E9%81%97%E4%BC%A0%E5%AD%A6%E7%A0%94%E7%A9%B6&sc_us=4337306961110480163&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8
三、甲基化测序技术与衰老
1、甲基化与衰老研究概述
已经建立起了通过检测细胞的DNA甲基化水平来推测机体的生理年龄及死亡率的模型,并且发现了一些组蛋白甲基化调节衰老的直接证据等。
1)甲基化与衰老研究的进展
(a)DNA甲基化与衰老研究的进展(亦可,参考http://www.docin.com/p-1253429367.html)
(b) 组蛋白甲基化与衰老研究的进展
2)引起衰老过程中甲基化水平异常变化的各种因素
(a)衰老过程中与甲基化水平相关的各种生理变化
(b)衰老过程中与甲基化水平相关的基因及通路
(c)衰老过程相关甲基化水平的改变与已知衰老相关风险因子的关系
参考:http://www.lifeomics.com/?p=35047
2、一个衰老模型,即表观基因组的微小变化,比如DNA甲基化状态,会随着时间推移而积累,并且导致基因表达和细胞功能更广泛的变化。
全基因组甲基化测序(WGBS),比较了一位103岁老年男性和一名新生男婴的DNA样本,从中分析了表观遗传修饰模式的差异。百岁老人的DNA甲基化区域比新生儿少50多万个位点,DNA甲基化水平降低了7%。这种甲基化水平的差异出现在基因组所有区域,包括启动子,外显子区域,内含子区域以及基因间区。这表明新生儿与百岁老人之间存在着基因表达模式的差异。此外,对26岁的青年人基因组分析表明,青年人DNA甲基化水平则介于两个极端年龄之间。
科研人员发现遗传因素对长寿仅起了10%的作用,而环境因素则起了90%的作用。表观遗传修饰,比如胞嘧啶甲基化,正是对环境刺激做出的一种的反应。本研究是首次从单核苷酸水平对新生儿和百岁老人的全部甲基化情况进行研究,为深入了解人类衰老、长寿及其他相关的疾病(如癌症)提供了重要的思路。作为一种程序化衰老机制,DNA甲基化的积累效应或许可以成为衡量生命衰老进程的关键标记。
参考:http://www.genomics.cn/news/show_news?nid=99104
以上是关于易基因:全基因组CpG密度和DNA甲基化分析方法比较(MeDIPRRBS和WGBS)| 研究综述的主要内容,如果未能解决你的问题,请参考以下文章
易基因:DNA甲基化和转录组分析揭示野生草莓干旱胁迫分子调控机制|植物抗逆