10X单细胞(10X空间转录组)聚类算法之Louvain

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了10X单细胞(10X空间转录组)聚类算法之Louvain相关的知识,希望对你有一定的参考价值。

参考技术A

社会网络(social network)是是由许多节点构成的一种社会结构,节点通常是指个人或组织,社会网络代表各种社会关系,社会网络关注的是人们之间的互动和联系,社会互动会影响人们的社会行为。对于社交网络的分析和研究范围很广,例如在社交网络中社区发现、基于好友关系为用户推荐商品或内容、社交网络中人物影响力的计算、信息在社交网络上的传播模型、虚假信息和机器人账号的识别、基于社交网络信息对股市、大选以及互联网金融行业中的反欺诈预测等。

现实生活中存在各种各样的社会网络,比如人际关系网、交易网、交通运输网等,对这些网络进行社区发现(community detection)具有极大的意义,如在微博构成的人际关系网络中,可以发现出具有不同兴趣爱好、背景的社会团体,方便进行不同的宣传策略和投放不同的广告;在以淘宝为代表的交易网中,不同的社区代表不同购买力的客户群体,社区发现可以方便运营为这些社区推荐合适的商品。

在社交网络中,有的用户之间的连接较为紧密,有的用户之间的连接关系较为稀疏,在这样的的网络中,连接较为紧密的部分可以被看成一个社区,其内部的节点之间有较为紧密的连接,而在两个社区间则相对连接较为稀疏,这便称为社团结构。

Louvain算法来自于Vincent等人发表的文章《Fast unfolding of communities in large networks》,是基于模块度(modularity)进行社区发现,该算法的优点在于速度快,可以在较短时间内实现大规模网络以不同粒度的社区划分( 这个就对应我们的Seurat的聚类参数resolution ),并且无需指定社区的数量,当模块度不再增益时候,迭代便自动停止。

Louvain算法处理大量数据的结果示例

算法简介

Newman等人在文章《Finding and evaluating community structure in networks》中提出了模块度(modularity)的概念,用来衡量社区划分的好坏。简单讲,如果一个社区划分算法能将连接比较稠密的点划分在一个社区中,而社区之间的连接比较稀疏,这样划分得到的网络模块度的值就会比较大,模块度越大的社区划分算法性能越好。

——模块度的计算

——模块度简单实现

模块度的值在[-1,1]之间,若所有的节点都被划分到一个社区内部,则此时模块度为1,若所有的节点各自为一个社区,则模块度为-1, 文章说当模块度的值在0.3~0.7之间则说明社区划分算法的效果很好 ,Louvain算法的优化目标为最大化整个数据的模块度。

——louvain算法的两个阶段

——模块度增量

——计算模块度

——计算模块度增量

——社区聚合

算法实现

算法测试

——数据导入

——测试结果

根据louvain算法结果,一共将数据“polbooks.gml”划分成4个社区,划分后网络的模块度为0.52,在0.3~0.7之间,可见划分结果还是比较优良。

实例运用

《权力的游戏》,是美国HBO电视网制作推出的一部中世纪史诗奇幻题材的电视剧。该剧改编自美国作家乔治·R·R·马丁的奇幻小说《冰与火之歌》系列。16年数学家 Andrew Beveridge和Jie Shan分析了小说《冰与火之歌》第三部《冰雨的风暴》中人物关系。在文章中介绍了如何通过文本分析和实体提取构建人物关系的网络,并使用社交网络分析算法对人物关系网络分析找出最重要的角色,最后应用社区发现算法来找到人物聚类。其中可视化是利用igraph实现,社区发现则是利用igraph中实现的walktrap方法。划分结果:

7 大子网络阵营

在这里,本文利用权利的游戏中角色之间的联系紧密产能度收集到的数据集,内含两个角色的名字和相互之间对应的权重,利这个数据进行简单的可视化工作,并且将louvain算法运用到上面,进行社区发现并且将划分的子网络通过网络图中不同的色彩标示出来。

实例运用

数据获取

——NetworkX

是用Python语言开发的图论与复杂网络建模工具,内置常用的图与复杂网络分析算法,可以方便的进行复杂网络数据分析、仿真建模等工作;支持创建无向图、有向图和多重图;

示例:

——community

是使用louvain方法进行社区发现的模块,在安装库的时候注意使用“pip install python-louvain”进行安装。

示例:

实例运用

数据可视化

实例运用

调用Louvain算法

——算法调用及划分结果局部展示

——划分后的模块度

前面我们说过当模块度的值为0.3-0.7则表示社区划分的效果比较好,可见这里的划分结果为0.5999说明划分效果很好。

实例运用

社区发现结果可视化

看过《权游》的人应该知道Cersei(瑟后)、Tyrion(小指头)和Jamie(弑君者)三人是姐弟关系,其他人物例如Aerys(疯王)、Tywin(瑟后他爹)、Oberyn(红毒蛇)、Gregor(魔山),这些都是以Cersei为中心的人物关系,而我们的社区发现算法也成功的将他们划分到了一个社区里面,可见louvain算法不仅速度快,而且划分的准确性也比较高。

生活很好,有你更好

跟着Cell学单细胞转录组分析(七):细胞亚群分析及细胞互作

参考技术A

想获取更多,请至公众号-KS科研分享与服务-

其实之前我们细胞的分群是很粗糙的,只是一个大概的方向,随着深入的研究,需要对特定细胞的更多亚群进行分析,这里我们选择免疫细胞进行分析,主要是为了跟随文章的脚步,也好完成后续一些示例,比如细胞互作,转录因子、拟时分析等。

首先提取免疫细胞群,然后跑一遍Seurat流程,重新聚类分群。

查看下免疫细胞marker的表达。

然后对细胞进行定群。

以上并不是新内容,亚群分析之后还可以和之前一样,做比例等。不过今天这里我们演示下细胞互作,用Cellcall这个比较简单的包。

=============================================

将GM和BM分开做互作,可以看看不同状态下细胞互作之间的区别。

BM的互作结果为,变化还是挺大的。

除了这些,cellcall还可以做其他的事情,具体参考:

https://github.com/ShellyCoder/cellcall

做细胞互作的工具很多,比如iTALK,Cellchat,CellphoneDB等,感兴趣的可以自己取探索下。好了,今天的分享就到这里了,其实这篇分享不是很严谨,主要是演示单细胞数据进一步分析思路,希望对大家有启发。

以上是关于10X单细胞(10X空间转录组)聚类算法之Louvain的主要内容,如果未能解决你的问题,请参考以下文章

10X单细胞(10X空间转录组)降维分析之UMAP

贝叶斯分类器(10X单细胞和10X空间转录组的基础算法)

10X单细胞(10X空间转录组)Seurat分析之QQplot的详细解释及绘制

技术 单细胞转录组测序之10x Genomics

10X单细胞转录组整合、转录组 && ATAC整合分析之VIPCCA

10X单细胞(10X空间转录组)之一张UMAP图同时展示两个基因的表达情况