无论集群中心如何初始化，Kmeans 算法是不是都能保证收敛？为啥？

Posted 2023-03-12

技术标签:

【中文标题】无论集群中心如何初始化，Kmeans 算法是不是都能保证收敛？为啥？【英文标题】：Is Kmeans algorithm guaranteed to converge regardless of how the cluster centers are initialized? Why?无论集群中心如何初始化，Kmeans 算法是否都能保证收敛？为什么？ 【发布时间】：2020-08-22 05:31:33 【问题描述】：

K-means 是一种随机初始化聚类中心的迭代算法。无论集群中心如何初始化，Kmeans 算法是否都能保证收敛？为什么？

【问题讨论】：

stats.stackexchange.com/questions/188087/… 【参考方案1】：

是的。它收敛但不覆盖到相同的结果，而不是以相同的速度覆盖。它在数学上证明了在 k-means 中寻找中心的迭代运行是收敛的。原因是：

在 k-means 的每次迭代中，到中心的距离总和都会减少。这是因为在每次迭代中如何选择中心（集群中心是每个集群节点的平均值）。这样，随着每次迭代中距离的总和减少，（因为您将每个节点分配到最近的中心）算法收敛。正如我之前所说，这种收敛有一个数学证明。 K-means是一种期望最大化（EM）算法，每个EM算法都会收敛。（你可以看这个证明，如果你有兴趣我可以用数学公式来解释。）

【讨论】：

以上是关于无论集群中心如何初始化，Kmeans 算法是不是都能保证收敛？为啥？的主要内容，如果未能解决你的问题，请参考以下文章