哪种聚类算法最适合聚类一维特征?
Posted
技术标签:
【中文标题】哪种聚类算法最适合聚类一维特征?【英文标题】:which clustering algorithm is best for clustering one-dimensional features? 【发布时间】:2016-10-14 08:14:11 【问题描述】:哪种聚类机器学习算法最适合用于聚类一维数值特征(标量值)? 是 Birch、Spectral clustering、k-means、DBSCAN...还是别的什么?
【问题讨论】:
【参考方案1】:所有这些方法都更适合多变量数据。除了历史上用于一维数据的 k-means 之外,它们都在设计时考虑了多变量问题,并且没有一个针对一维数据的特定情况进行了很好的优化。 p>
对于一维数据,使用核密度估计。 KDE 是一种很好的一维技术,具有强大的统计支持,并且难以用于多维聚类。
【讨论】:
【参考方案2】:看看K-means clustering algorithm。该算法非常适用于聚类一维特征向量。但是 K 意味着当您的训练数据集中存在异常值时,聚类算法不能很好地工作,在这种情况下您可以使用一些高级机器学习算法。
我建议在为您的数据集和问题陈述实施机器学习算法(分类、聚类等)之前,您可以使用Weka Toolkit 来检查哪种算法最适合您的问题陈述。 Weka 工具包是大量机器学习和数据挖掘算法的集合,可以针对给定问题轻松实现。一旦确定了哪种算法最适合您的问题,您就可以修改或编写自己的算法实现。通过调整它,您甚至可以获得更高的准确性。你可以从这里downloadweka。
【讨论】:
以上是关于哪种聚类算法最适合聚类一维特征?的主要内容,如果未能解决你的问题,请参考以下文章