三类OTU聚类算法

Posted Listenlii

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了三类OTU聚类算法相关的知识,希望对你有一定的参考价值。

三类OTU聚类算法

本文介绍一下3种OTU聚类算法,这些算法使用不同的规则来确定新序列是添加到现有cluster(OTU)中,还是形成一个新的cluster:

三类OTU聚类算法

complete linkage, 具体如furthest neighbor

average linkage, 具体如average neighbor 或 UPGMA(非加权组平均法) 

single linkage, 具体如nearest neighbor


三类OTU聚类算法

当使用3% cut-off作为cluster的划分依据时:

complete linkage要求新序列和一个cluster中的其他所有序列不相似度都低于3%,这个新序列才能进入这个cluster。

average linkage要求新序列和一个cluster中的其他所有序列不相似度的平均值低于3%,这个新序列能进入这个cluster。

single linkage要求新序列和一个cluster中的其他所有序列不相似度中存在一个低于3%,这个新序列就能进入这个cluster。

显然的,complete linkage标准最严,因此得到的OTU数量一般最多。


三类OTU聚类算法
三类OTU聚类算法

以上概念参考:2010年的EM

Link:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2909393/


三类OTU聚类算法

作者发现complete linkage会使得OTU数量虚高。因此先采用了 2% single-linkage的聚类方法,之后再使用average-linkage聚类,得到的OTU数量更准确。可以减少环境样本中30-60%的OTU,与此同时可以保留稀有物种。


三类OTU聚类算法
END



一个环境工程专业却做生信分析的深井冰博士,深受拖延症的困扰。想给自己一点压力,争取能够不定期分享学到的生信小技能,亦或看文献过程中的一些笔记与小收获,记录生活中的杂七杂八。

目前能力有限,尚不能创造知识,只是知识的搬运工。

欢迎分享,转载请联系我。

以上是关于三类OTU聚类算法的主要内容,如果未能解决你的问题,请参考以下文章

无监督学习DBSCAN聚类算法原理介绍,以及代码实现

5.无监督学习-DBSCAN聚类算法及应用

k均值算法

关于聚类模型的一些理解和总结

聚类算法之K-Means算法Spark实践

Python气象数据处理与绘图:聚类算法(K-means轨迹聚类)