单细胞测序平台的比较(2014-2020)
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了单细胞测序平台的比较(2014-2020)相关的知识,希望对你有一定的参考价值。
参考技术A 单细胞(single cell)分选平台比较(10X Genomics,BD Rhapsody,Fluidigm C1)那么问题就来了:
从上图中我们可以看到,2010年-2014年之间,单细胞测序领域采用的主流技术的细胞通量都在100以内,哪怕是最为先进的Fluidigm C1平台也是如此。因此我们在2014-2016年间看到的大量Single-Cell Seq的高分文章的单个细胞测序数量一般都在1000以内,因为这1000个细胞代价极大。
Fluidigm C1平台,是最早被应用于Single Cell领域的商业化分选技术,基于富鲁达(Fluidigm®)的微流控技术,大约在几个小时中可以捕获96个左右的细胞,进行各类的Single-Cell测序建库。当然,通量还是比较小。但不可否认的是,现在很多非RNA类Single Cell测序,仍然在采用这样的技术,如Single Cell DNA-Seq,Single Cell ATAC-Seq等,都是采用此技术进行单细胞分选后再分别用不同试剂盒建库。所以可以说,至少在10X和BD,或者其他企业推出有效的Single DNA测序技术之前,C1仍然会是市场上的重要组成部分。
令人亢奋的是,在2014-2015年间几个**性技术诞生了,仿佛寒武纪大爆发一般,MARS-Seq、CytoSeq、Drop-Seq、inDrop技术在这两年中扎堆出现,真正引爆了Single-Cell这个领域。而在2017-2018年,商业化的测序平台(10X Genomics®, BD Rhapsody®),逐渐浮出水面,才最终让Single-Cell测序技术走进了民用市场。
10X Genomics
BD Rhapsody
从成本上来说,基于C1类的捕获技术的代价非常大,单细胞捕获成本在9-30美元不等,而且这还是一个没有关税、没有代理商加价的价格。2000-3000细胞需要18000-100000美元不等的捕获费用,可以说非壕不可用的技术。因此暂时就不做详细讲解了。
Ziegenhain C, Vieth B, Parekh S, et al. Comparative analysis of single-cell RNA sequencing methods[J]. Molecular cell, 2017, 65(4): 631-643. e4.
主要讲讲两个现在的主流技术,BD Rhapsody以及10X Genomics。从诞生年代来看,两者不分伯仲,10X Genomics起源自Drop-Seq技术,得益于哈佛大学的研究所的工作。
从Drop-Seq技术到10X Genomics技术
BD的Rhapsody平台,最早可以追溯到2015年Single Cell Cytoseq技术,可以说是完全同时代的技术。2017年BD也携一篇研究脑神经的Nature Article将该商业化技术发布了。(Birey F, Andersen J, Makinson C D, et al. Assembly of functionally integrated human forebrain spheroids[J]. Nature, 2017, 545(7652): 54.)
10X Genomics和Drop-Seq具有类似的技术原理。从横向孔道中逐一输入凝胶微珠,第一纵向孔道输入细胞,凝胶微珠与细胞碰撞后会吸附在凝胶微珠上,并通过微流控技术,将之输入到第二纵向孔道,即油相孔道中。这时候,就形成了一个个油滴,最终输出并收集在EP管中。每一个油滴中会落入一个细胞以及一个凝胶微珠,那么在每一个凝胶微珠中上长满了不同的Cell Barcode和UMI Barcode连接形成的序列,再加上一端PolyT的抓手,构成我们的捕获凝胶微珠。而这个凝胶微珠抓手就会使用oligo dT抓住mRNA构建文库。
10X Genomics凝胶微珠设计
所以一个油滴=一个单细胞=一个凝胶微珠=一个RNA-Seq,可以说这就是10X的基本技术原理。
然而市场并不只有一家Single Cell的商业化捕获平台,另外还有BD这个老牌的抗体巨头的Rhapsody平台。这个平台又是依托什么技术,和10X Genomics技术存在什么区别呢?
BD的技术不再采用利用微流控孔道射出细胞和射出的磁珠碰撞的过程,进行单细胞捕获的技术,转而采用CytoSeq特有的蜂窝板技术。该技术用20W+的微孔(该数量级远大于Input细胞数量),保证单孔中的单细胞捕获。同时避免了10X中存在的概率碰撞影响捕获效率的问题,采用微孔捕获相对会有更好的捕获效率(来自两家企业商业宣传资料比对),保证Input细胞的全面使用。对于Input细胞的量更少的情况,可以基于10E5的细胞总量开始进行前期处理以及后期捕获操作。(烈小冰在之前的实验技术分享里提到过 Single Cell前处理会丢失一些细胞哦!) 而在细胞捕获完成后,进行细胞裂解后,同样的也进行细胞中RNA polyA序列的抓取工作。
BD Rhapsody 单细胞mRNA抓取过程
所以一个微孔=一个单细胞=一个磁珠=一个RNA-Seq,可以说这就是BD的基本技术原理。
从现有数据来看,我们很难比较两种技术的优劣,但是从现有的文章发表情况来看,两种技术都在主流高IF期刊上有可信的数据发表,并且都与Smart-Seq数据的结果存在比较,因此两种技术都是可用可信的大规模Single Cell RNA-Seq技术。从发布时间来看,10X发布更早,而BD发布在其1年之后,这点上10X Genomics的设备稍占优势。而在捕获效率和有效性来看,BD Rhapsody的捕获效率更高较占优势。
从技术原理上分析两种Single Cell测序技术,都是基于UMI(Unique Molecular Identifier)+ CL(Cell Label)的技术,与传统Smart-Seq + Fluidigm的C1技术比较起来,引入UMI技术(这个我们会在分析部分简单介绍)进行表达定量,使得大规模scRNA-Seq的基因表达定量结果几乎不会受到PCR Bias影响,从而更精确。
图注:如果一个基因具有序列一致的UMI序列的测序Reads,那么这条Reads其实PCR Bias
Ziegenhain C, Vieth B, Parekh S, et al. Comparative analysis of single-cell RNA sequencing methods[J]. Molecular cell, 2017, 65(4): 631-643. e4.
单细胞测序数据的差异表达分析方法总结
无论是传统的多细胞转录组测序(bulk RNA-seq)还是单细胞转录组测序(scRNA-seq),差异表达分析(differential expression analysis)是比较两组不同样本基因表达异同的基本方法,可获得一组样本相对于另一组样本表达显著上调(up-regulated)和下调的基因(down-regulated),从而可进一步研究这些差异表达基因的功能,包括富集的通路(pathway)或生物学过程(biological process)。
由于单细胞测序技术的局限性,单细胞测序数据通常具有高噪音,有较高的dropout问题,即很多低表达或中度表达的基因无法有效检测到。所以,以前针对传统多细胞转录组测序数据开发的差异表达检测方法或软件不一定完全适用于单细胞测序数据。若想比较不同细胞亚型或不同条件下的细胞表达差异时,为了能得到可靠的结果,需要选定一个好的差异表达分析方法(微信公众号:AIPuFuBio)。
近年来,有不少专门针对单细胞转录组测序数据的差异表达分析方法相继被开发出来,如MAST (Finak et al., 2015)、SCDE (Kharchenko et al., 2014)、 DEsingle (Miao et al., 2018)、 Census (Qiu et al., 2017)、 BCseq (Chen and Zheng, 2018)等。具体可以见下表所示:
红线上方是专门针对单细胞测序数据开发的差异表达分析软件或R包,红色下方是针对bulk转录组数据开发的软件或R包
这里要值得提一下SCDE(全名:Single Cell Differential Expression)软件,其属于最早一批专门针对单细胞测序数据开发的差异表达分析软件,地址为:https://hms-dbmi.github.io/scde/。下图是原文章中SCDE与其他传统差异表达分析软件的性能比较,显示SCDE具有不错的性能。
图2、SCDE与其他软件在单细胞测序数据集上鉴定差异表达基因的性能比较(Kharchenko et al. Nature Methods, 2014)
最近,Wang et al.等人比较了11款经典的软件在单细胞测序测序数据集上的差异表达分析性能,这些软件具体如下表所示:
图5、不同差异表达软件各主要指标的比较( Wang et al. BMC Bioinformatics, 2019)
图6、不同差异表达软件之间在真实数据集上检测到的差异表达基因比较( Wang et al. BMC Bioinformatics, 2019)。差异表达基因的定义为:adjusted p-value< 0.05
图7、样本数量对不同差异表达软件各方面性能的影响比较( Wang et al. BMC Bioinformatics, 2019)
图8、不同差异表达软件鉴定到的top 300个差异表达基因富集的显著KEGG通路数和GO条目数比较( Wang et al. BMC Bioinformatics, 2019) 。(条件:FDR<0.05)
总的来说,不同的差异表达软件有不同的优缺点。有些软件具有高灵敏性,但检测精度却比较低,有些则刚好相反。这11款软件中,DEsingle 和SigEMD这两个方法较好的平衡了差异表达基因检测灵敏性和准确性。值得注意的是,Wang et al. 的比较发现,现在这些专门针对单细胞测序数据开发的差异表达分析软件和传统的方法相比,并没有显示出太多的优势( Wang et al. BMC Bioinformatics, 2019)。这也进一步说明,还需不断开发新的单细胞测序差异表达分析方法,以更好的检测单细胞测序数据的差异表达基因。(更多经典,可见大型免费综合生物信息学资源和工具平台AIPuFu:www.aipufu.com)。笔者建议,做单细胞测序数据的差异表达分析,最好还是选择专门针对单细胞测序数据开发的软件,如SCDE、DEsingle 和SigEMD等。
希望今天的内容对大家有用哦,会持续更新的,欢迎留言~~
参考文献
1. Chen et al. Single-Cell RNA-Seq Technologies and Related Computational Data Analysis,Frontiers in Genetics, 2019
2. Wang et al. Comparative analysis of differential gene expression analysis tools for single-cell RNA sequencing data, BMC Bioinformatics, 2019
3. Kharchenko et al. Bayesian approach to single-cell differential expression analysis, Nature Methods, 2014
以上是关于单细胞测序平台的比较(2014-2020)的主要内容,如果未能解决你的问题,请参考以下文章