[机器学习]二分k-means算法详解
Posted 图解AI
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[机器学习]二分k-means算法详解相关的知识,希望对你有一定的参考价值。
二分k-means
算法
二分k-means
算法是分层聚类(Hierarchical clustering)的一种,分层聚类是聚类分析中常用的方法。
分层聚类的策略一般有两种:
- 聚合。这是一种
自底向上
的方法,每一个观察者初始化本身为一类,然后两两结合 - 分裂。这是一种
自顶向下
的方法,所有观察者初始化为一类,然后递归地分裂它们
二分k-means
算法是分裂法的一种。
1 二分k-means
的步骤
二分k-means
算法是k-means
算法的改进算法,相比k-means
算法,它有如下优点:
- 二分
k-means
算法可以加速k-means
算法的执行速度,因为它的相似度计算少了 - 能够克服
k-means
收敛于局部最小的缺点
二分k-means
算法的一般流程如下所示:
-
(1)把所有数据初始化为一个簇,将这个簇分为两个簇。
-
(2)选择满足条件的可以分解的簇。选择条件综合考虑簇的元素个数以及聚类代价(也就是误差平方和
SSE
),误
以上是关于[机器学习]二分k-means算法详解的主要内容,如果未能解决你的问题,请参考以下文章
机器学习算法:知道canopyK-means++二分K-meansK-medoids的优化原理