转录因子实验研究方法都有哪些?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了转录因子实验研究方法都有哪些?相关的知识,希望对你有一定的参考价值。
参考技术A1.什么是转录因子
转录因子(Transcription factor,TF)的调控决定着基因的调控网络以及表达水平。基因的表达驱动着一系列的细胞活动,这些表达的调控需要通过转录因子(蛋白)和转录因子结合位点(DNA元件)的相互作用实现。转录水平的调控不是一个简单的独立过程,它是由上百个转录因子,目标序列以及共调控因子所组成的高度互作的基因调控网络。
2.为什么研究转录因子
一个课题最开始往往是研究某个基因的序列信息以及基因所行驶的功能作用,这些是属于基因的下游研究。但在下游研究累积到一定经验之后,老师往往开始着手于研究基因的上游调控机理,即不单关注基因A如何影响细胞活动,更关注哪些因素影响基因A的功能发挥。调控机理研究理论上会涉及多个层面的因素,例如:转录因子、蛋白激酶、miRNA、DNA甲基化、组蛋白修饰、lncRNA……
转录因子成为调控机理的研究大户是最正常不过的事情。因为一个转录因子能同时控制多个基因的表达,同时转录因子的功能作用也可能受多个共作用因子的影响。如果能阐明如此复杂的调控网络,这可是很有科研成就感的。
3.研究方法
现有主流的转录因子鉴别方法可分为两种:传统实验鉴别(experimental methods)以及通过计算机进行的生物信息学鉴别(computational methods)。简单来说,实验方法主要用于寻找不同类型目标,即通过已知TF寻找未知TFBS,或通过已知TFBS找出其对应TF。而生物信息学方法更多是用于同类型的预测,即通过序列保守性分析,通过已知TF预测未知TF,或通过已知TFBS预测未知TFBS。这些研究思路的关系如图1.
图1. 转录因子研究方式
3.1生物信息学预测(computational methods)
无论是TF还是TFBS的同类预测,生物信息的研究手段主要依赖于蛋白质或者DNA的序列保守性进行。具体算法和软件有隐马尔可夫模型,Gibbs抽样,贪婪算法等,但这次重点在于介绍研究转录因子的实验方法,因此不过于叙述这部分信息。
3.2实验方法筛选(experimentalmethods)
实验方法主要有两种思路:1. 通过已知TF寻找未知TFBS;2.通过已知TFBS寻找未知TF。无论哪种手段,前提都是基于蛋白与DNA之间的结合关系寻找,即交叉寻找目标,这有别于计算机技术的同类型寻找。
3.2.1通过已知TF寻找未知TFBS
如果已经锁定了一个感兴趣的TF,那常用思路是确定其TFBS,然后得知道它控制的下游基因。从已知TF定位到未知TFBS的过程,主要的实验方法包括ChIP-seq、DNaseI-seq、DamID-seq等体内实验,以及DIP-seq、SELEX(-seq)、PBM等体外实验。
这些研究的通量与应用范围如图2所示,其中,纵坐标表示可以从多大范围检测TFBS(检测通量),横坐标表示TF-TFBS的结合细节(检测精细程度)。以ChIP-seq为例,它可以在全基因组水平一次发现超过20万个结合位点信息,但只能确定到TFBS的序列信息(是ATTCG还是ACTCG),却难以了解到目标TF与TFBS之间的结合程度(TFBS能与TF结合多久,结合多牢固等信息)。
图2.多种转录因子研究方法的比较。 (CS:ConsensusSite,PWM: Position WeightMatrices)
3.2.1.1SELEX技术
Systematicevolution of ligands by exponential enrichment (SELEX) 是其中最早的一种体外检测转录因子结合位点技术,这项技术在20多年前已被科学家们利用,而且它不需要已知序列信息就可以检测到新的结合位点。它的原理是(图3a):1.提取并纯化转录因子;2.随机打断的DNA文库与目标转录因子孵育;3.提取与TF结合的DNA,进一步PCR扩增片段;4.把PCR扩增的片段重复与TF孵育,最终筛选出高结合率的DNA。SELEX技术不需要已知的DNA片段信息就可以检测新TFBS,但不足之处在于它只能找出结合率高的TFBS,因此鉴定效率较低。
为了解决鉴定效率较低的问题,高通量测序技术可以联合SELEX筛选TFBS。关联高通量技术后,SELEX-seq只需要一轮筛选而不像之前需要多轮筛选,但它的问题在需要大量的高质量纯化蛋白以及前期实验操作复杂。
3.2.1.2Protein-binding Microarrays (PBM)技术
PBM技术(图3b)首先固定双链dna列阵在芯片当中,然后加入感兴趣的目标蛋白,孵育洗脱非结合蛋白后,加入带有荧光标记的抗体靶向目标蛋白,最后通过荧光信号鉴别蛋白-DNA结合关系。荧光强度会最终换算为PositionWeight Matrices(PWM),从而计算DNA的结合序列。
3.2.1.3DIP-seq
DIP-seq(图3c)是另外一种体外检测转录因子与dna关系的技术。与PBM不同,这种技术不需要预先固定DNA,它是通过检测染色质DNA来实现目标鉴定。大体的实验流程可分为:1.利用甲醛交联转录因子与DNA片段;2.切断DNA为100到500bp的片段;3.通过转录因子特异性抗体,富集与TF结合的DNA;4.去交联后,富集DNA进行芯片或高通量测序。
3.2.1.4ChIP-seq
ChIP-seq的实验过程与之间介绍的DIP-seq非常类似,唯一不同是,ChIP-seq可以通过甲醛原位交联TF与DNA,而DIP-seq只能在体外交联。ChIP-seq的优点是更高的分辨率,更低的噪音等。但它的弊端在于1.过于依赖蛋白数量,2.依赖于交联效率,3.抗体特异性及获取可能性。4.难以分辨直接结合还是间接结合的TF。
图3. 多种主流TF鉴定技术的操作流程
3.2.1.5.mechanically induced trapping of molecular interactions(****MITOMI)
MITOMI是少数可以测量TF与DNA解离系数Kd的实验技术,它具有中等通量,但却不适合用于de novo的TFBS鉴定。MITOMI具体流程图4:
1.将感兴趣的tf固定在玻璃上,接通微流管,倒入DNA;
2.DNA结合到固定的tf上;
3.富集结合的DNA,并洗脱未结合的片段;
4.通过富集的DNA数量计算蛋白-DNA解离系数Kd。
图4. MITOMI原理示意图
3.2.2.通过已知TFBS寻找未知****TF
比较常见的实验研究方法是酵母单杂交(Yeast one Hybrid,Y1H)及被称为反向ChIP实验 的PICh(Proteomicsof Isolated Chromatin segments)。
3.2.2.1酵母单杂交 (Y1H)
酵母单杂交能筛选到与DNA结合的蛋白质,并可直接从基因文库中得到编码该蛋白质的核苷酸序列,而无需复杂的蛋白质分离纯化操作,故在蛋白研究中,具有一定的优势;而且,酵母属真核细胞,通过酵母系统得到的结果,比其他体外技术获得的结果,更能体现真核细胞内基因表达调控的真实情况。
主要实验过程为:
1.把感兴趣的TFBS序列(Bait)插入报告基因上游,并将带有TFBS与报告基因的质粒整合到酵母基因组中,构建含有报告基因的酵母;
2.提取mRNA构建转录因子cDNA文库,并将文库与酵母激活因子融合相连,构建“Prey”文库。把带有文库的质粒转入到步骤1的酵母中。
3.条件筛选生长酵母,如果TF与TFBS有结合,即报告基因可以顺利表达。
图5.酵母单杂交技术原理
3.2.2.2PICh实验
PICh,又被称为反向ChIP实验,实际是通过分离的感兴趣DNA片段富集转录因子,最终利用质谱技术鉴定所富集的蛋白质。PICh所分离的TF难以被识别为直接还是间接结合因子,同时,现阶段来说,这项技术的通量相对较低,不适合大批量筛选TF。
注意事项
1.体外实验虽然可以鉴别很多蛋白-DNA相互作用,但由于生物体复杂性(共调控因子,竞争性转录因子等),这些体外识别的相互作用难以在体内重复或发现。
2.体内实验比较真实地还原转录因子-DNA之间的作用,却难以鉴别出直接还是间接作用关系。
3.利用PBM方法可以完成de novo TFBS鉴别。
4.检测通量一般受限于蛋白质的纯化质量及数量。
5.大多数方法难以分析解离系数,因此对DNA或蛋白质的洗脱难以把握。
6.除了实验方法,通过计算机技术鉴别结合位点的保守性从而预测新的转录因子目标区域已经被大量使用。但无论何种算法,这些预测都过于简单化TF-DNA之间的作用关系,从而造成极高的预测假阳性率。
7.(i)ChIP, HT-SELEX, 或PBM方法的目的在于发现结合序列或PWM。 (ii) MITOMI分析可用于进一步分析定量信息。(iii) ChIP实验可用于分析体内结合信息。
附录
多种体内外TF鉴定方法的对比:
method:方法;
synomyms:实验名称;
throughput:检测通量;
materialsneeds:所需实验材料,其中P代表protein,D代表DNA,“+”到“++++”分别代表数据可用于定性,半定量,定量及动力学分析;
Datatype:实验所产生的数据类型;
resolution:分辨率(可检测碱基程度)。
10X单细胞转录组整合、转录组 && ATAC整合分析之VIPCCA
参考技术A单细胞测序在基因调控、细胞分化和细胞多样性研究中具有革命性意义 。 随着近年来技术的显着改进,每个实验检测的单细胞数量呈指数级增长,同时大规模研究产生的数据集也在快速增长和积累。 因此, 当前单细胞研究中的一个主要计算挑战是对来自多个不同样本或跨不同平台和数据类型的测量进行标准化,以进行有效的综合和比较分析 。 这种综合分析需要开发单细胞数据对齐方法,该方法可以消除批次效应并考虑跨数据集的技术噪声。
最近开发了许多单细胞数据对齐方法 。它们中的大多数,除了一些值得注意的例外,例如最近的 iNMF ,都针对小型和中型数据集。这些现有的方法可以概括为四类:(i) 基于参考的方法 ,例如 Scmap-cluster 和 scAlign,它们基于注释良好的参考数据集对齐新的查询数据集; (ii) 基于聚类的方法 ,例如 Harmony 、DESC,它们通过迭代优化聚类目标函数来消除批效应并在嵌入空间中对齐样本; (iii) 基于匹配的方法 ,例如 MNN 和 Scanorama ,它们应用相互最近的邻居策略来识别跨数据集的重叠单元格和 (iv) 基于投影的方法 ,使用统计模型将来自不同数据集的单个细胞投影到较低的维空间,包括对投影应用典型相关分析的 Seurat ,使用来自非负矩阵分解的潜在因子进行投影的 LIGER , and scVI and others that use variational techniques for projection.
然而, 大多数现有的对齐方法都存在固有缺陷,无法成功应用于大型数据集 。具体而言, 基于参考的方法的对齐将受到参考数据大小和参考中可用的预选细胞类型注释的限制,因此当数据大小增加时,可能会导致错过新发现的机会增加 。像 MNN 这样的基于匹配的方法使用往返游走策略,该策略需要为具有两个以上样本的数据集生成所有成对对齐,这对于大样本量来说将是耗时的。具有复杂参数模型的方法(例如 LIGER 和 scAlign)或具有复杂事后数据处理的方法(例如 Seurat )也难以扩展到大型数据集。 基于 ZINB 的方法(例如 scVI)在捕获多个数据集的复杂表达特征方面可能效率较低 。尽管一些现有的最新方法可以扩展到大型数据集,但由于复杂的参数模型,它们仍然有可能不准确地对齐细胞。因此, 迫切需要开发在计算上也有效的有效对齐方法 。
除了迫切需要开发可扩展的比对方法外,当前比对方法的另一个阻碍问题是它们的性能通常仅使用单细胞 RNA 测序 (scRNA-seq) 数据进行基准测试和优化。 因此,大多数现有的比对方法不适合整合其他单细胞测序数据类型,例如使用测序 (scATAC-seq) 进行转座酶可及染色质的单细胞测定。 此外, 现有的比对方法(如 Seurat)返回的结果只能保留真实的细胞间关系(或相似性),而不能代表基因表达水平,不适合进行差异表达分析或富集分析等下游分析 。
为了应对这些挑战, 作者提出了一个统一的计算框架 VIPCCA,它基于非线性概率典型相关分析,用于有效且可扩展的单细胞数据对齐 。 VIPCCA 利用来自深度神经网络的尖端技术对单细胞数据进行非线性建模,从而允许用户通过跨技术、数据类型、条件和模式的多个单细胞数据集的集成来捕获复杂的生物结构。此外,VIPCCA 依靠 变分推理 来进行可扩展计算,从而能够将大规模单细胞数据集与数百万个细胞有效集成。重要的是,VIPCCA 可以将多模态转换为低维空间,而无需任何事后数据处理,这是与现有对齐方法形成直接对比的独特且理想的功能。
加载
Loading data
该函数仅适用于 fit_integrate() 函数训练生成的 AnnData。 在基因表达矩阵中随机选择 2000 个位置。 x轴代表这些位置原始数据的表达值,y轴代表同一位置的vipcca整合后数据的表达值。
After filter, we converting Seurat Object to AnnData via h5Seurat using R packages. In this case, the atac.h5ad file will be generated in the corresponding path .
生活很好,有你更好
以上是关于转录因子实验研究方法都有哪些?的主要内容,如果未能解决你的问题,请参考以下文章
转录调控实战 | 一文解决转录调控问题 | chIP-seq | ATAC-seq