在 Python 2.7 的 scikit-learn 之外是不是有任何 K-means++ 实现?

Posted

技术标签:

【中文标题】在 Python 2.7 的 scikit-learn 之外是不是有任何 K-means++ 实现?【英文标题】:Is there any K-means++ implementation outside of scikit-learn for Python 2.7?在 Python 2.7 的 scikit-learn 之外是否有任何 K-means++ 实现? 【发布时间】:2017-01-27 05:25:00 【问题描述】:

我并不反对 scikit-learn,但我必须安装 anaconda 才能获得它,这有点突兀。

【问题讨论】:

例如scipy。但有些人说这是超级慢。 (在 Windows 等某些系统上安装 scipy 和较小范围的 scikit-learn 并不那么容易的原因是需要速度 -> cython、blas、fortran 有很多工具可以用来提高速度;我总是更喜欢 安装 anaconda 让您有机会通过简单的设置使用最好的工具!) scipy中的kmeans没有实现kmeans++,它随机采样,运行多次采样,返回最佳结果。 我的错。我没有仔细阅读它!但是kmeans++中的初始化非常简单,可以自己实现。我仍然会坚持使用 scikit-learn,但好吧...... 我做过(在 python 中),但它有点慢;我想我会坚持使用 Anaconda,也许可以实现这个:vldb.org/pvldb/vol5/p622_bahmanbahmani_vldb2012.pdf @Eduardo 我之前已经实现过,它运行速度相当快,应该可以在 python 2.7 上运行(我只在 py3 上使用过,所以不能保证):github.com/tttthomasssss/clustering/blob/master/…。 【参考方案1】:

所以,目前的情况是:除了 scikit-learn 之外,没有分布式 Python 实现 KMeans++。如果一个好的实现进入 scipy,这种情况可能会改变。

【讨论】:

以上是关于在 Python 2.7 的 scikit-learn 之外是不是有任何 K-means++ 实现?的主要内容,如果未能解决你的问题,请参考以下文章

由于系统 Python 2.7 的要求,Pygame 安装失败,即使我有 Python 2.7

python机器学习库哪个比较好些

Python升级版本2.6到2.7

使用 OpenCV+Python-2.7 进行全身检测和跟踪

代码在python 2.6下无效,但在2.7中很好[重复]

强制 Nosetests 使用 Python 2.7 而不是 3.4