有比 K 方法更快的聚类方法吗?

Posted

技术标签:

【中文标题】有比 K 方法更快的聚类方法吗?【英文标题】:Any much faster methods for clustering than K means? 【发布时间】:2020-04-22 21:34:54 【问题描述】:

我在一个盒子里有手写数字,我想把手写数字拉出来。尺寸为 208 x 117,即大约 24k 像素。

我想利用我有颜色这一事实,所以我决定使用聚类算法来隔离数字的颜色,然后只提取那些像素。问题是我需要将其降低到每位数 0.01 秒,而现在 sklearn.cluster.KMeans 大约需要 0.15 秒。我尝试调整图像大小,但这本身需要时间,我还尝试使用阈值来获取彩色像素并忽略浅色背景(使我降低到 10k 像素),但这并没有加快速度。

有什么想法吗?

【问题讨论】:

【参考方案1】:

我找到了办法。事实证明,通过减少样本量,您可以获得巨大的加速。所以我只是随机抽取了四分之一的像素并将其输入到聚类函数中。我得到了 50 倍的加速。

【讨论】:

以上是关于有比 K 方法更快的聚类方法吗?的主要内容,如果未能解决你的问题,请参考以下文章

基于最大最小距离的分类数目上限K确定的聚类方法

K均值聚类法和系统聚类法有啥区别,这两种聚类方法的适用条件都是啥?

聚类:层次聚类基于划分的聚类(k-means)基于密度的聚类基于模型的聚类

K-Mean 聚类:评估新的聚类中心

基于密度的聚类方法

聚类算法(BIRCH)