哪种聚类算法最适合聚类一维特征?

Posted

技术标签:

【中文标题】哪种聚类算法最适合聚类一维特征?【英文标题】:which clustering algorithm is best for clustering one-dimensional features? 【发布时间】:2016-10-14 08:14:11 【问题描述】:

哪种聚类机器学习算法最适合用于聚类一维数值特征(标量值)? 是 Birch、Spectral clustering、k-means、DBSCAN...还是别的什么?

【问题讨论】:

【参考方案1】:

所有这些方法都更适合多变量数据。除了历史上用于一维数据的 k-means 之外,它们都在设计时考虑了多变量问题,并且没有一个针对一维数据的特定情况进行了很好的优化。 p>

对于一维数据,使用核密度估计。 KDE 是一种很好的一维技术,具有强大的统计支持,并且难以用于多维聚类。

【讨论】:

【参考方案2】:

看看K-means clustering algorithm。该算法非常适用于聚类一维特征向量。但是 K 意味着当您的训练数据集中存在异常值时,聚类算法不能很好地工作,在这种情况下您可以使用一些高级机器学习算法。

我建议在为您的数据集和问题陈述实施机器学习算法(分类、聚类等)之前,您可以使用Weka Toolkit 来检查哪种算法最适合您的问题陈述。 Weka 工具包是大量机器学习和数据挖掘算法的集合,可以针对给定问题轻松实现。一旦确定了哪种算法最适合您的问题,您就可以修改或编写自己的算法实现。通过调整它,您甚至可以获得更高的准确性。你可以从这里downloadweka。

【讨论】:

以上是关于哪种聚类算法最适合聚类一维特征?的主要内容,如果未能解决你的问题,请参考以下文章

哪种算法以及哪种超参数组合最适合对这些数据进行聚类?

5种聚类算法!数据分析师必须要掌握

深度剖析:数据科学家需要了解的5种聚类算法

一文盘点5种聚类算法,数据科学家必备!

三种聚类方法:层次、K均值、密度

数据科学家必须要掌握的5种聚类算法