目标序列捕获测序常见问题集锦
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了目标序列捕获测序常见问题集锦相关的知识,希望对你有一定的参考价值。
参考技术A 目前的序列捕获系统有:NimbleGen Sequence Capture Array、Agilent SureSelect DNA Capture Array及Agilent SureSelect Target Enrichment System。 利用捕获系统得到目标序列后,可以应用Roche GS FLX Titanium 、Illumina Solexa GA IIx和AB SOLID 4对目标序列进行大规模测序分析。目标区域捕获技术与目前高通量测序技术结合能应用于外显子区域以及候选基因组区域等的重测序上,可用来发现和分析SNP位点以帮助寻找许多复杂疾病相关基因及位点。
答:(1)植物样品来源要求是黑暗无菌条件下培养的黄化苗或组培样品,最好为纯合或单倍体。基因组完整无降解,OD值在1.8~2.0 之间;样品浓度大于30 ng/l;样品总量不小于500μg,详细要求参见项目合同附件。
(2)动物样品来源应选用肌肉,血等脂肪含量少的部位。基因组完整无降解,OD值在1.8~2.0 之间;样品浓度大于30 ng/l;样品总量不小于500μg,详细要求参见项目合同附件。
答:目前,目标捕获测序主要有以下三种捕获方法:
(1) NimbleGen Sequence Capture array + Solexa测序。
(2) Agilent SureSelect DNA Capture Array + SOLiD/Solexa/Roche 454测序。
(3) Agilent SureSelect Target Enrichment System + Solexa/SOLiD/Roche 454测序。
其各自特点如下:
答:以外显子捕获结合Solexa测序为例。实验步骤大体如下(如图1):(1)对基因组DNA进行片段化处理;(2)对片段化的双链DNA进行末端修复;(3)将“A”碱基加入到DNA片段的3’末端;(4)连接特定的测序接头DNA片段的两端;(5)纯化连接产物以除去未连接的接头序列;(6)LM-PCR的线性扩增纯化好的文库,并纯化扩增产物;(7)将检测合格的产物合格后的DNA片段与NimbleGen 2.1M Human Exome Array芯片进行杂交;(8)去除未与芯片结合的背景DNA,将经过富集的外显子区域的DNA片段洗脱下来;(9)这些DNA片段又随机连接成长DNA片段后,再次被随机打断并在其两端加上测序接头;(6)经过LM-PCR的线性扩增,在经qPCR质量检测合格后即可上机测序。
答:Agilent SureSelect序列捕获有固相捕获(芯片)和液相捕获两种,固相捕获(芯片)其基本方法同NimbleGen芯片捕获方法,在此我们主要以Agilent SureSelect Target Enrichment System 液相捕获系统结合Solexa测序进行说明,其主要流程如下(图1):(1)对基因组DNA进行片段化处理;(2)对片段化的双链DNA进行末端修复;(3)将“A”碱基加入到DNA片段的3’末端;(4)连接特定的测序接头DNA片段的两端;(5)纯化连接产物以除去未连接的接头序列;(6)PCR扩增连有接头的片段DNA并纯化;(7)样品文库检测;(8)样本文库、SureSelect capture library在杂交缓冲液中进行杂交;(9)Dynal磁珠捕获杂交的目的DNA片段并分离纯化,除去未结合的DNA片段并消化RNA;(10) PCR扩增捕获的DNA片段并纯化PCR产物;(11)捕获得到的样本文库检测。
答:捕获的特异性受各种因素影响,如捕获探针的设计不佳,捕获条件不理想,基因组DNA中重复序列的封闭不充分及基因组DNA与捕获探针的比例不合适等因素都会影响捕获 的特异性。
答:目标捕获测序和基因组重测序在数据分析方面有很多的相似之处,它们用的算法和软件都可以相互通用,分析的步骤也大同小异。目标捕获测序可以对基因组的特定区域进行测序,例如外显子区域,而基因组重测序是对全部基因组进行测序,没有经过筛选的过程。简单看来,目标捕获测序只是基因组目标区域的重测序,获得的信息要比全基因组重测序要少。目标捕获测序只是对基因组目标区域进行重测序,测序量要低,这就允许更多的样品同时进行测序,降低成本,而且这些区域都是人们关心的区域,得到信息更加集中有用。但是,这对目标捕获测序的测序前处理提出了更高的要求,研究人员能否把握关键区段成了目标捕获测序能否获得最大成功的瓶颈。
利用minimap2和samtools简化目标基因组拼接
参考技术A 最近打算测一些干燥材料和标本材料的浅层基因组,有些材料降解严重,拼接的过程可能会比较困难。由于我们的目标主要是转录组的数据,所以试试看能不能在拼接之前将与转录组无关的序列直接在原始测序数据中删除。minimap2和samtools安装都比较简单,这里就不行详细介绍了。
首先我们选择一个转录组数据进行建库作为参考的比对序列
这样就建立了一个参考库
sam文件(上一步得到的那种文件)是一种列表格式,用来记录reads比对到参考基因组上的信息,包括哪一条reads,比对到哪条基因组上的哪个位置,是一对一比对还是一对多比对,有无错配,错配是怎样的。因此就需要包含很多列的信息,下面具体展示sam格式。
比对得到的sam或者bam不能直接用于下游的数据处理,需要进行很多处理。主要包括转换为bam,排序,合并不同lane的数据,对bam文件加头部信息等操作。而这些工作都可以使用samtools工具来进行操作。samtools顾名思义,是处理sam格式的工具合集。samtools主要包含以下几大功能:Indexing 建立索引,Editing 编辑文件,File operations,Statistics,统计相关功能;Viewing,查看,等
常用参数:
详细操作不讲了,直接提取需要的目标序列
最后得到一个fasta文件,使用这个fasta文件就可以进行下一步的序列拼接了。
之后使用Trinity进行拼接测试,但是总是运行一段时间就莫名其妙的断掉了,也没有任何报错信息,后来将输出的fasta文件改成fastq文件之后可以正常拼接,输出fastq的命令问
以上是关于目标序列捕获测序常见问题集锦的主要内容,如果未能解决你的问题,请参考以下文章