单细胞分析之细胞交互-5:NicheNet多组间互作比较

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了单细胞分析之细胞交互-5:NicheNet多组间互作比较相关的知识,希望对你有一定的参考价值。

参考技术A

之前写过 NicheNet 的标准分析pipeline,实际上做细胞互作分析的时候我们更多的还是在做样本间的互作差异比较。平常我用CellChat比较多,但其实NicheNet也可以做多样本互作比较,而且效果更好。

加载所需要的包

读入演示数据

这个演示里面比较的是pEMT-high-niche和pEMT-low-niche,换成不同组都一样的。

读入NicheNet 受体配体网络 (25345*688)和 受体配体矩阵

如果分析的是小鼠的数据,需要先做一下基因的同源转换

每个niche应该至少有一个“sender/niche”细胞群和一个“receiver/target”细胞群。
在这个演示数据集中,我们想要去查看pEMT high和pEMT low的肿瘤组织中免疫细胞对肿瘤细胞的作用差异。因此“Malignant_High”和“Malignant_Low”被定义为“receiver/target”细胞群,其它细胞被定义为“sender/niche”细胞群。注意:T.Cell和Myeloid细胞只有在pEMT-High样本中才被定义为sender,因为pEMT-low样本中这两类细胞数目太少了。
⚠️也就是说,NicheNet在做组间比较的时候,可以把condition-specific的细胞群考虑在内。(比较的是所有sender细胞的组间差异,而不是细胞特异性组间差异)

! Important: your receiver cell type should consist of 1 cluster!

In this step, we will determine DE between the different niches for both senders and receivers to define the DE of L-R pairs.
这里得到的是差异性受体配体对

计算差异基因的方法默认是Seurat Wilcoxon test(也可以使用其它方法)。

可以看到,它是先计算了Sender:high的5种sender细胞分别和low的3中sender细胞的Sender DE,又反过来计算了low的3中sender细胞分别和high的5种sender细胞的DE。
然后计算了Receiver:肿瘤细胞high-low的差异基因和low-high的差异基因。
这样把细胞类型分开挨个计算而不是把所有sender和receiver细胞合并计算的意义是避免差异分析的结果主要被丰度高的细胞驱动。

根据细胞表达基因的百分比对差异基因做一下初步筛选,只有在超过设定阈值(10%)的细胞中有表达的基因才会被认为是普遍表达的差异基因。

如前所述,来自一种sender细胞的差异表达的配体是通过计算该样品这种sender细胞和另一样品中所有sender细胞得到的。因此我们有多种方法总结得到细胞类型的差异表达配体。我们可以使用average LFC,也可以使用minimum LFC。但是更推荐使用 minimum LFC 。因为它是评估配体表达的最强的特异性指标,因为高的min LFC意味着和niche 2中的所有细胞类型相比,这个配体在niche 1的这个细胞类型中表达更强(如果使用average LFC,则不能排除niche 2中一种或多种细胞也很强的表达这个配体)。

这一步主要得到了 DE_sender_receiver 这个对象,也就是不同niche中的差异基因。

限空间转录组数据

在这一步中,我们将要预测不同niches中receiver细胞类型的每个配体的活性。(和常规NicheNet的配体活性分析类似)。
为了计算配体活性,我们首先需要在每个niche中分别定义一个感兴趣的基因集。在这个示例中,pEMT-high的基因集是和pEMT-low肿瘤相比,pEMT-high中的上调基因。pEMT-low的基因集则相反。

在做配体活性分析之前,最好还是做一下基因集中的基因数的检测。一般认为对配体活性分析来说,感兴趣的基因集中有20-1000基因是比较合适的。如果得到的DE基因数过多,推荐使用更高的 lfc_cutoff 阈值。在有>2的receiver细胞/niches时或,我们建议使用0.15的cutoff值。如果只有2组receiver细胞/niches时,我们建议使用更高的阈值(比如0.25)。如果是测序深度比较深的数据比如Smart-seq2,同样建议使用更高的阈值。
在这个演示数据中,我们使用的是Smart-seq2的数据,而且只有比较了2个niches,所以我们使用高LFC阈值以得到更少的DE基因(更高的阈值得到的DE基因 更少,可信度更高)。

在这一步中,我们将会计算受体、配体和靶基因在不同细胞群中的平均(scaled)表达和表达fraction。这里是使用DotPlot展示的,也可以用其他方式展示。

这一步得到了ligand, receptor和target的表达表。以exprs_tbl_ligand为例,每个表中都有ligand/ receptor/ target的细胞类型,表达量和在细胞中的表达百分比。

在这一步中,我们将会基于受体表达强度计算配体-受体互作,对各细胞类型里各配体的受体进行打分,表达最强的受体将被给予最高的评分。这不会影响随后对单个配体的排序,但是将会帮助我们对每个配体最重要的受体进行排序。(next to other factors regarding the receptor - see later).

在这一步中,我们将会结合上面所有的计算结果来对ligand-receptor-target直接的links进行排序。We scale every property of interest between 0 and 1, and the final prioritization score is a weighted sum of the scaled scores of all the properties of interest.

We provide the user the option to consider the following properties for prioritization (of which the weights are defined in prioritizing_weights ) :

Note: these settings will give substantially more weight to DE ligand-receptor pairs compared to activity. Users can change this if wanted, just like other settings can be changed if that would be better to tackle the specific biological question you want to address.

在可视化之前,我们需要先定义每个niche中最重要的配体受体对。We will do this by first determining for which niche the highest score is found for each ligand/ligand-receptor pair. And then getting the top 50 ligands per niche.

Now we will look first at the top ligand-receptor pairs for KCs (here, we will take the top 2 scoring receptors per prioritized ligand)

Visualization: minimum LFC compared to other niches

Show the spatialDE as additional information

单细胞空间转录分析之Scanpy

参考技术A

将空间位置信息和转录组分析相结合,对于癌症、免疫、肿瘤免疫相互作用,组织微环境,神经和发育等领域,有着令人期待的应用前景。

单细胞的一切分析,加前缀Spatial 都是一个新的分析点,因此Scanpy 扩展后也可用于空间转录组数据分析。 https://scanpy-tutorials.readthedocs.io/en/latest/spatial/integration-scanorama.html

python 包Scanpy很多函数是借鉴了R包Seurat,所以这两种方法分析结果差异不大,大家可以对照Seurat分析,上面网址也提供了Seurat包处理单细胞空间转录分析过程。

和分析单细胞转录组数据一样,单细胞空间转录组主要包括了:质控(QC),标准化(Normalization),降维聚类(Dimensional reduction and clustering),Cluster marker genes, Spatially variable genes

为了和Seurat结果比较,我们使用了相同的一套数据集: https://support.10xgenomics.com/spatial-gene-expression/datasets/1.1.0/V1_Mouse_Brain_Sagittal_Anterior , 新鲜的冷冻小鼠脑组织, 前牙矢状切面,可以参考前面讲述的ABA大脑图谱: https://www.jianshu.com/p/5d087fffeb35
导入相关包

读取数据

预处理

我们根据总counts和表达的genes对spots进行一些基本的过滤:

这儿和Seurat得到的QC小提琴图一样,只是形式不同。

标准化,HVG

PCA,聚类,可视化

每一簇marker genes

空间特异性genes

保存数据

我们可以发现与Seurat相比,分类结果还是有差异,不过大的区域识别两种方法都没有什么问题。

以上是关于单细胞分析之细胞交互-5:NicheNet多组间互作比较的主要内容,如果未能解决你的问题,请参考以下文章

10X单细胞 & 10XATAC 联合分析表征细胞调控网络(MIRA)

10X单细胞(10X空间转录组)Seurat分析之QQplot的详细解释及绘制

10X单细胞个性化分析之CNV篇

10X单细胞转录组整合、转录组 && ATAC整合分析之VIPCCA

10X单细胞(10X空间转录组)多样本批次效应去除分析之RCA2

10X单细胞(10X空间转录组)降维分析之UMAP