如何创建大小相等的集群

Posted

技术标签:

【中文标题】如何创建大小相等的集群【英文标题】:How to create clusters with equal sizes 【发布时间】:2021-05-11 17:48:18 【问题描述】:

我有大量数据。无论集群的数量是多少,我都想创建大小相等的集群。我为此使用 SMILE 库。我应该使用什么聚类方法或如何实现具有相同大小的聚类的聚类。

【问题讨论】:

【参考方案1】:

关于这个话题有一些讨论。

https://elki-project.github.io/tutorial/same-size_k_means

Group n points in k clusters of equal size

K-means algorithm variation with equal cluster size

另外,请查看 Affinity Propagation 和 DBSCAN。两者都是非常流行的 K-Means 算法的绝佳替代品,并且与 K-Means 不同,两者都能自动找到最佳聚类数。

https://hdbscan.readthedocs.io/en/latest/comparing_clustering_algorithms.html

我并不是说这些会为您提供相同大小的集群,但了解这些其他替代方法是很好的,并且使用这些方法可能比强制集群具有相同数量的数据点更实用。聚类是一种无监督的分析类型。似乎强制集群具有相同大小的结果在某种程度上是一种强制方法,并且几乎是有监督的,但它并不是设计的。

【讨论】:

以上是关于如何创建大小相等的集群的主要内容,如果未能解决你的问题,请参考以下文章

在大小相等的 k 个集群中对 n 个点进行分组

如何创建平衡的 k-means 地理空间集群?

在列数相等的表上应用 UNION 时出现“无法创建行...大于允许的最大行大小”错误

用于获得相等大小的聚类的聚类算法

UIScrollview 宽度不能与 iPhone 大小相等

如何使用 UICollectionViewCompositionalLayout 创建具有相等行高的网格布局