Nat Comm | 周翔组开发单细胞RNA测序数据分析新方法 – iDEA

Posted BioArt

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Nat Comm | 周翔组开发单细胞RNA测序数据分析新方法 – iDEA相关的知识,希望对你有一定的参考价值。

责编 | 酶美


近日,美国密歇根大学、生物统计系周翔副教授课题组(https://www.xzlab.org;博士研究生马莹为第一作者,孙世权博士为共同第一作者)Nature Communications杂志上发表方法研究型长文:Integrative Differential Expression and Gene Set Enrichment Analysis Using Summary Statistics for scRNA-seq Studies,提出了一种单细胞RNA测序数据(scRNA-seq)差异表达基因和基因富集联合分析的新方法iDEA



基因差异表达(DE)分析和基因集富集(GSE)分析在单细胞RNA测序(scRNA-seq)研究中有着广泛的应用。作者开发了一种集成的、可扩展的计算方法iDEA来执行DE和GSE联合分析。该方法利用层次贝叶斯框架 (Hierarchical Bayesian) 对单细胞RNA测序的概括统计数据(Summary Statistics)进行建模,通过一个内层马尔可夫链蒙特卡罗(MCMC)步骤的期望最大化(EM)算法对该模型进行求解,采用了Louis Method来对EM-MCMC算法估计出来的富集参数(Enrichment Parameter)的信息矩阵(Observed Information)进行校正。相比于目前常规的基于单细胞RNA测序原始数据建模的DE方法能提高因不同统计模型构架下DE方法识别出来的的差异性表达基因的一致性,并且避免由于分析大规模单细胞RNA测序原始数据而导致的计算复杂性。相比于现有的GSE方法,iDEA能有效地控制第一类错误(Type I Error),提高GSE分析的统计检验效能(Statistical Power)。基于对单细胞RNA测序的概括统计数据(Summary Statistics),iDEA进行了DE分析和GSE的联合分析,通过模型里DE分析结果和GSE分析结果的相互反馈,来提高两种分析的统计检验效能(Statistical Power)和结果的可重复性、一致性,是单细胞RNA测序数据一个快速、有效且灵活的分析工具。



本文通过设计大量的仿真实验 (Simulations) 评估iDEA模型与算法的有效性和优劣性,并且通过三个公开实例数据验证模型与算法的实用性。这三个实例数据来自不同的物种、组织(人胚胎干细胞,老鼠感觉神经元,人外周血单个核细胞),和三种不同的单细胞测序技术(SMARTer,STRT-Seq ,10x Genomics)。在这三个实例数据上,iDEA 能比现有DE方法提高 64%的统计检验效能,而iDEA的基因集统计检验效更能达到现有GSE方法的五倍。以人胚胎干细胞为例,iDEA识别的差异表达基因是以前DE方法zingeR的1.6倍。这些iDEA多识别出来的基因有明显的生物学意义:热图结果显示这些识别的基因有明显的表达差异,通过与已知人胚胎干细胞标记基因验证,iDEA识别了大量与内胚层干细胞分化(definitive endoderm cell differentiation)相关的基因,其中包括基因SMAD3, GATA3等。同时,在这个人胚胎干细胞实例数据上,iDEA识别到的基因集是之前GSEA方法的2倍。iDEA识别的基因集中了大量与人胚胎干细胞发展有关基因集,其中transforming growth factor beta (TGF-beta) receptor signaling pathway以及vasculature development。


简而言之,本文提出了一个快速、有效的新方法iDEA,通过数值模拟和实例分析表明该方法可以很好地控制第一类错误,同时识别出差异表达基因和富集的基因集,且具有较高的统计功效。iDEA的R软件包可以从Zhou Lab网站https://www.xzlab.org/software.html 下载、安装;R软件安装方法及示例数据分析详细说明文档见网站https://github.com/xzhoulab/iDEA ;本文测试的实例数据,实验分析代码可从网站https://github.com/xzhoulab/iDEA-Analysis 下载。


另外,周翔老师课题组目前有一个博士后职位,该职位侧重于开发用于全基因组关联研究或功能基因组测序研究中的高维生物学数据的统计方法和计算工具。感兴趣的申请者可发简历(CV)至邮箱xzhousph@umich.edu


一、招聘研究方向但不限于


1.单细胞测序数据的建模、分析与研究
2.亚硫酸氢盐测序,RNA-seq或其他功能基因组学测序研究中的差异表达分析
3.利用基因型或测序数据估计SNP遗传力和表型预测
4.利用基因型,基因表达和其它组学数据进行整合分析


二、应聘条件


1、具有统计学、应用数学、计算机、自动化、生物信息学等研究背景
2、以第一作者身份在国际重要学术刊物上发表过研究论文,并且具有较强的英文写作与阅读能力
3、具有良好的沟通能力和团队协作精神,努力勤奋,身心健康,乐观向上


原文链接:
https://www.nature.com/articles/s41467-020-15298-6

制版人:珂

以上是关于Nat Comm | 周翔组开发单细胞RNA测序数据分析新方法 – iDEA的主要内容,如果未能解决你的问题,请参考以下文章

RNA测序究竟有多可靠

单细胞转录组测序数据的可变剪接(alternative splicing)分析方法总结

单细胞转录组测序知识一隅

深度好文 单细胞RNA测序技术简介

单细胞测序技术

8种特殊建库测序