如何创建大小相等的集群
Posted
技术标签:
【中文标题】如何创建大小相等的集群【英文标题】:How to create clusters with equal sizes 【发布时间】:2021-05-11 17:48:18 【问题描述】:我有大量数据。无论集群的数量是多少,我都想创建大小相等的集群。我为此使用 SMILE 库。我应该使用什么聚类方法或如何实现具有相同大小的聚类的聚类。
【问题讨论】:
【参考方案1】:关于这个话题有一些讨论。
https://elki-project.github.io/tutorial/same-size_k_means
Group n points in k clusters of equal size
K-means algorithm variation with equal cluster size
另外,请查看 Affinity Propagation 和 DBSCAN。两者都是非常流行的 K-Means 算法的绝佳替代品,并且与 K-Means 不同,两者都能自动找到最佳聚类数。
https://hdbscan.readthedocs.io/en/latest/comparing_clustering_algorithms.html
我并不是说这些会为您提供相同大小的集群,但了解这些其他替代方法是很好的,并且使用这些方法可能比强制集群具有相同数量的数据点更实用。聚类是一种无监督的分析类型。似乎强制集群具有相同大小的结果在某种程度上是一种强制方法,并且几乎是有监督的,但它并不是设计的。
【讨论】:
以上是关于如何创建大小相等的集群的主要内容,如果未能解决你的问题,请参考以下文章
在列数相等的表上应用 UNION 时出现“无法创建行...大于允许的最大行大小”错误