Clustering by fast search and find of density peaks

Posted 2020-09-06

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Clustering by fast search and find of density peaks相关的知识，希望对你有一定的参考价值。

"Clustering by fast search and find of density peaks"是20114年6月份在《Science》期刊上发表的的一篇论文，论文中提出了一种非常巧妙的聚类算法。

首先，该算法是基于这样的假设：

（1）聚类中心密度要高

（2）高密度中心点之间的距离应该相对远一些。

异常点都会被排除，同时也和形状无关。

首先，这种方法不像原先的Kmeans那样随机初始种子点然后迭代，它是根据样本的密度峰值来确定聚类中心的，当然聚类中心确定之后，后面的问题就方便多了，由于不需要迭代，时间消耗非常低，小规模的话可以忽略。下面看看这篇文章是怎么找到局部密度峰值的（其实这里的密度峰值有点类似正态分布的样子）。

1、局部密度

局部密度就定义为别的所有点的距离小于截断距离的个数。

2、Delta距离

Delta距离定义取比该点局部密度大的所有点的最小距离，如果这个点已经是局部密度最大的点，那么Delta赋值为别的所有点到它的最大距离。

最后，相对应的聚类中心就是相对Delta值比较大的点，如果好几个相近点的Delta值都比较大，而且比较接近，那么任何一个都可以当作该类的中心。

实验测试:

参考：

本文出自 “IT技术学习与交流” 博客，谢绝转载！

以上是关于Clustering by fast search and find of density peaks的主要内容，如果未能解决你的问题，请参考以下文章