[机器学习]二分k-means算法详解

Posted 图解AI

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[机器学习]二分k-means算法详解相关的知识,希望对你有一定的参考价值。

二分k-means算法

  二分k-means算法是分层聚类(Hierarchical clustering)的一种,分层聚类是聚类分析中常用的方法。
分层聚类的策略一般有两种:

  • 聚合。这是一种自底向上的方法,每一个观察者初始化本身为一类,然后两两结合
  • 分裂。这是一种自顶向下的方法,所有观察者初始化为一类,然后递归地分裂它们

  二分k-means算法是分裂法的一种。

1 二分k-means的步骤

  二分k-means算法是k-means算法的改进算法,相比k-means算法,它有如下优点:

  • 二分k-means算法可以加速k-means算法的执行速度,因为它的相似度计算少了
  • 能够克服k-means收敛于局部最小的缺点

  二分k-means算法的一般流程如下所示:

  • (1)把所有数据初始化为一个簇,将这个簇分为两个簇。

  • (2)选择满足条件的可以分解的簇。选择条件综合考虑簇的元素个数以及聚类代价(也就是误差平方和SSE),误

以上是关于[机器学习]二分k-means算法详解的主要内容,如果未能解决你的问题,请参考以下文章

机器学习---算法---k-means算法

机器学习算法:知道canopyK-means++二分K-meansK-medoids的优化原理

机器学习K-Means算法优化

K-means 聚类算法的理解与案例实战

机器学习强基计划7-2:图文详解K-均值聚类(K-means)算法(附Python实现)

K-Means 聚类算法原理分析与代码实现