对角聚类的 K 均值
Posted
技术标签:
【中文标题】对角聚类的 K 均值【英文标题】:K-Means for diagonal clusters 【发布时间】:2017-01-15 01:17:39 【问题描述】:我目前有 2 个集群,它们基本上位于 3D 表面上的 2 条线上:
我尝试了一个简单的 kmeans 算法,它产生了上述分离。 (大红点是手段)
我尝试使用软 k 均值进行聚类,每个均值沿 3 个维度具有不同的方差。但是,它也未能对此进行建模,可能是因为它无法拟合对角高斯的形状。
是否有另一种算法可以考虑到数据是对角线的?或者,有没有一种方法可以从本质上“旋转”数据,以便可以使软 k-means 起作用?
【问题讨论】:
k-means 只是学习高斯混合模型的一个特例。一般的高斯混合模型也会捕捉到旋转。 如果我不得不猜测异常值更有可能使您的聚类偏向右侧。尝试删除这些异常值并再次尝试聚类。 【参考方案1】:K-means 没有为相关性做好充分准备。
但这些集群在我看来是合理的高斯分布,您应该尝试高斯混合建模。
【讨论】:
以上是关于对角聚类的 K 均值的主要内容,如果未能解决你的问题,请参考以下文章