哪种聚类算法最适合聚类一维特征？

Posted 2023-03-12

技术标签:

【中文标题】哪种聚类算法最适合聚类一维特征？【英文标题】：which clustering algorithm is best for clustering one-dimensional features? 【发布时间】：2016-10-14 08:14:11 【问题描述】：

哪种聚类机器学习算法最适合用于聚类一维数值特征（标量值）？是 Birch、Spectral clustering、k-means、DBSCAN...还是别的什么？

【问题讨论】：

【参考方案1】：

所有这些方法都更适合多变量数据。除了历史上用于一维数据的 k-means 之外，它们都在设计时考虑了多变量问题，并且没有一个针对一维数据的特定情况进行了很好的优化。 p>

对于一维数据，使用核密度估计。 KDE 是一种很好的一维技术，具有强大的统计支持，并且难以用于多维聚类。

【讨论】：

【参考方案2】：

看看K-means clustering algorithm。该算法非常适用于聚类一维特征向量。但是 K 意味着当您的训练数据集中存在异常值时，聚类算法不能很好地工作，在这种情况下您可以使用一些高级机器学习算法。

我建议在为您的数据集和问题陈述实施机器学习算法（分类、聚类等）之前，您可以使用Weka Toolkit 来检查哪种算法最适合您的问题陈述。 Weka 工具包是大量机器学习和数据挖掘算法的集合，可以针对给定问题轻松实现。一旦确定了哪种算法最适合您的问题，您就可以修改或编写自己的算法实现。通过调整它，您甚至可以获得更高的准确性。你可以从这里downloadweka。

【讨论】：

以上是关于哪种聚类算法最适合聚类一维特征？的主要内容，如果未能解决你的问题，请参考以下文章

哪种算法以及哪种超参数组合最适合对这些数据进行聚类？

5种聚类算法！数据分析师必须要掌握

深度剖析：数据科学家需要了解的5种聚类算法

一文盘点5种聚类算法，数据科学家必备！

三种聚类方法：层次、K均值、密度

数据科学家必须要掌握的5种聚类算法