单细胞CNV分析-copyKAT

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了单细胞CNV分析-copyKAT相关的知识,希望对你有一定的参考价值。

参考技术A

对于肿瘤的单细胞样本,在做完细胞质控和细胞类型鉴定之后,可以进入CNV分析。

在统计学上,CopyKAT将贝叶斯方法与层次聚类相结合,计算单个细胞的基因组拷贝数分布,并从高通量单细胞转录组数据中定义克隆子结构。
首先,单细胞转录组数据的Unique Molecular Identifier(UMI)的基因表达矩阵作为CopyKAT的输入,通过它们的基因组坐标对它们进行排序,并对基因的排列进行注释。之后,用Freeman-Tukey变换来稳定方差,然后采用多项式动态线性建模矫正单细胞UMI计数矩阵中的异常值。
下一步是建立一个高可信度的正常二倍体细胞子集,用来推测正常二倍体细胞的拷贝数基线值。为此,研究人员将所有单细胞集中到几个小的亚群分类中,并使用高斯混合模型估算每个分类的方差。通过严格的分类标准,具有最小估计方差的聚类被定义为“标准的二倍体细胞”。
为了检测染色体断点,他们整合泊松-伽玛模型和马尔可夫链蒙特卡罗迭代生成每个基因窗口的后验均值,然后应用Kolmogorov-Smirnov检验对均值无显著差异的相邻窗口进行合并,然后计算每个窗口的最终拷贝数值,以此作为跨越每个细胞中相邻染色体断点的所有基因的后验平均值。

⚠️:做CNV输入的是原始的count数据。有文献提示,使用count数据和log后的data数据来做分析没有什么差别(copyKAT和inferCNV都是),但还是建议使用count数据,因为它自己会进行log标准化。

copyKAT进行CNV分析不需要给正常的/恶性的参考细胞,它会自己从数据集中判断哪些是最接近于2倍体的正常细胞,以正常细胞为参考,其他细胞跟正常细胞相比来推测CNV变异。

上一步运行得到的cnv的结构:

把神经元细胞分成了恶性的和非恶性的,可以看到,非恶性的有23个,恶性的有91个。

后续可以根据需要使用subset将恶性细胞提出来进行后续更深入的分析。

跟着Cell学单细胞转录组分析(七):细胞亚群分析及细胞互作

参考技术A

想获取更多,请至公众号-KS科研分享与服务-

其实之前我们细胞的分群是很粗糙的,只是一个大概的方向,随着深入的研究,需要对特定细胞的更多亚群进行分析,这里我们选择免疫细胞进行分析,主要是为了跟随文章的脚步,也好完成后续一些示例,比如细胞互作,转录因子、拟时分析等。

首先提取免疫细胞群,然后跑一遍Seurat流程,重新聚类分群。

查看下免疫细胞marker的表达。

然后对细胞进行定群。

以上并不是新内容,亚群分析之后还可以和之前一样,做比例等。不过今天这里我们演示下细胞互作,用Cellcall这个比较简单的包。

=============================================

将GM和BM分开做互作,可以看看不同状态下细胞互作之间的区别。

BM的互作结果为,变化还是挺大的。

除了这些,cellcall还可以做其他的事情,具体参考:

https://github.com/ShellyCoder/cellcall

做细胞互作的工具很多,比如iTALK,Cellchat,CellphoneDB等,感兴趣的可以自己取探索下。好了,今天的分享就到这里了,其实这篇分享不是很严谨,主要是演示单细胞数据进一步分析思路,希望对大家有启发。

以上是关于单细胞CNV分析-copyKAT的主要内容,如果未能解决你的问题,请参考以下文章

肿瘤分析数据挖掘及信息解读

用R语言对vcf文件进行数据挖掘.11 CNV分析

单细胞ATAC亚群分析

玩转单细胞高级分析 单细胞富集分析篇

单细胞测序的设计与分析

单细胞之富集分析-3:GO和KEGG富集分析及绘图