对角聚类的 K 均值

Posted

技术标签:

【中文标题】对角聚类的 K 均值【英文标题】:K-Means for diagonal clusters 【发布时间】:2017-01-15 01:17:39 【问题描述】:

我目前有 2 个集群,它们基本上位于 3D 表面上的 2 条线上:

我尝试了一个简单的 kmeans 算法,它产生了上述分离。 (大红点是手段)

我尝试使用软 k 均值进行聚类,每个均值沿 3 个维度具有不同的方差。但是,它也未能对此进行建模,可能是因为它无法拟合对角高斯的形状。

是否有另一种算法可以考虑到数据是对角线的?或者,有没有一种方法可以从本质上“旋转”数据,以便可以使软 k-means 起作用?

【问题讨论】:

k-means 只是学习高斯混合模型的一个特例。一般的高斯混合模型也会捕捉到旋转。 如果我不得不猜测异常值更有可能使您的聚类偏向右侧。尝试删除这些异常值并再次尝试聚类。 【参考方案1】:

K-means 没有为相关性做好充分准备。

但这些集群在我看来是合理的高斯分布,您应该尝试高斯混合建模

【讨论】:

以上是关于对角聚类的 K 均值的主要内容,如果未能解决你的问题,请参考以下文章

第十四章聚类方法.14.3K均值聚类

数字数据集上的K-均值聚类

K 均值聚类:更新每个聚类的质心并选择颜色的功能

K均值聚类算法

是否可以使用数字属性作为 K 均值聚类的类?

k-均值聚类