单细胞SingleR鉴定细胞类型
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了单细胞SingleR鉴定细胞类型相关的知识,希望对你有一定的参考价值。
参考技术A SingleR 是用于单细胞RNA测序(scRNAseq)数据的自动注释方法(Aran et al.2019)。给定具有已知标签的样本(单细胞或RNAseq)参考数据集,它将基于与参考数据的相似性标记测试数据集中的新细胞。具体来说,对于每个测试单元:SingleR 通过专用的数据检索功能提供了多个参考数据集(主要来自大量RNA-seq或微阵列数据)。例如,我们使用 HumanPrimaryCellAtlasData() 函数从人类原代细胞图集获得参考数据,该函数返回一个 SummarizedExperiment 对象,该对象包含带有样本级标签的对数表达值矩阵。
我们的测试数据集将取自La Manno et al. (2016)。
为了提高速度,我们只选取100个细胞来标记细胞类型。
默认的检测marker的方法是largest positive log-fold changes in the per-label medians for each gene.
输出的每一行都包含单个细胞的预测结果。在 fine-tuning(first.labels)之前, fine-tuning()之后labels和after pruning (pruned.labels)之后的细胞标签,以及相关的分数。
统计细胞个数
在这里,我们将使用两个人类胰腺数据集。目的是使用一个预先标记的数据集注释另一个未标记的数据集。
SingleR() ,与之前一样的用法,但是这次使用了marker检测模式,该模式考虑了跨细胞种类表达的差异。在这里,将使用Wilcoxon ranked sum test来识别marker。与默认检测算法相比,此方法更慢,但更适合单细胞数据。
SingleR 提供了强大的可视化工具。 plotScoreHeatmap() 显示所有参考标签上的分数,这使用户可以检查整个数据集中预测标签的置信度。每个细胞的实际分配标签显示在顶部。理想情况下,每个cell(即热图的一列)应具有一个明显大于其余得分的分数,表明已将其明确分配给标签。
欢迎关注!
reference:
https://www.nature.com/articles/s41590-018-0276-y
https://bioconductor.org/packages/devel/bioc/vignettes/SingleR/inst/doc/SingleR.html
跟着Cell学单细胞转录组分析(五):单细胞转录组marker基因鉴定及细胞群注释
参考技术A 书接上回( 跟着Cell学单细胞转录组分析(四):单细胞转录组测序UMAP降维聚类 )。完成数据降维和细胞聚类后,最主要的环节和工作就是确定各个细胞群,明确是什么类型的细胞,正群的细胞定群很关键,涉及到整个研究,所以这一步宁愿多费时间,也不要出错。当然,这也不是一蹴而就的,需要反复的确认。要确定各个群是什么细胞,首先需要了解细胞群的marker基因,因为不同类型的细胞突出 表达的基因也是不同的。这里使用FindAllMarkers鉴定各个细胞群的高表达基因。
Seurat提供了几种函数例如FeaturePlot()、DotPlot()和DoHeatmap(),按照文章中的mrker基因,做一下可视化。
点图:
UMAP图:
热图:
很显然,这些都是默认出图,距离发文章还是有一定距离的,后期我们会专门讲解个性化的修饰,争取可视化更好。
接下来就是细胞定群了,对各个细胞群命名。细胞定群有很多方法,目前也有很多工具,但是依照我的经验,自动定群等一般结果不是完全正确,况且操作复杂,为了保证正确性,最使用的办法还是查询文献定群。定群后,对细胞群重命名。
最后将命名的文件保存,可视化细胞群!在进行下一步工作之前,之后的内容将会是对目前这些图形结果的修饰和个性化可视化!
以上是关于单细胞SingleR鉴定细胞类型的主要内容,如果未能解决你的问题,请参考以下文章
跟着Cell学单细胞转录组分析(五):单细胞转录组marker基因鉴定及细胞群注释
ItClust:将神经网络的迁移学习用于单细胞RNA测序分析的聚类和细胞类型分类算法
单细胞数据整合方法 | Comprehensive Integration of Single-Cell Data
单细胞论文记录(part9)--Spatial charting of single-cell transcriptomes in tissues