Java集群库[关闭]

Posted

技术标签:

【中文标题】Java集群库[关闭]【英文标题】:Java Clustering Library [closed] 【发布时间】:2011-01-08 21:54:40 【问题描述】:

我正在寻找 java 中的轻量级聚类库。我不需要该库中的 100 个聚类算法,只需 5 到 7 个算法对我来说就可以了。

我敢肯定,您会问:“您需要什么样的算法以及用于什么目的”:)。我只需要在聚类的帮助下对我的数据进行分类。例如 K 表示。

P.S:我知道 weka,但我不想使用它,因为它不是专门用于集群的。

【问题讨论】:

集群是什么意思?是weka sth。给你? 对不起,我没有得到你的答案。什么是什么? 注意以备将来参考......在软件开发中,“集群”通常意味着en.wikipedia.org/wiki/Cluster_%28computing%29 @skaffman 不是真的,请参阅数据挖掘或en.wikipedia.org/wiki/Cluster_analysis @agazerboy ……意味着什么。 for weka 看看这里en.wikipedia.org/wiki/Weka_%28machine_learning%29 那么,您是指数据挖掘技术吗?啊,好吧,我读了你的编辑... 【参考方案1】:

看看 Apache 的 Commons Math 库中的 org.apache.commons.math4.ml.clustering.KMeansPlusPlusClusterer。

【讨论】:

【参考方案2】:

如果你想要一些Java中的基本聚类算法,可以查看我的软件:

http://www.philippe-fournier-viger.com/spmf/

它提供了 KMeans 和层次聚类算法的实现。

提供的其他算法用于模式挖掘。总共有 47 种算法。但只有 2 个用于聚类。另一件事:有一个用于启动算法的简单 GUI。

【讨论】:

【参考方案3】:

如果 Scala 也适用于您,那么您可能需要在 Scala 中检查此版本的 KMeans:

https://github.com/wspringer/kmeans

相关的博文在这里:

http://nxt.flotsam.nl/k-means-clustering.html

【讨论】:

【参考方案4】:

Cytoscape 软件有几个插件可以实现网络和数值数据的聚类算法(Nemo、MCODE、clusterMaker 等)。所有插件都是开源的。

【讨论】:

【参考方案5】:

还有ELKI,一个类似于 WEKA 的开源大学项目,但侧重于聚类分析和异常值检测,而不是机器学习算法。 它相当先进,使用索引结构来提高效率,并且至少有十几种聚类算法。

【讨论】:

【参考方案6】:

这里有一些 Java 中的开源集群算法,这些算法在 GPL 下可用。需要 Java Colt 库(用于矩阵)。 http://open.trickl.com/

【讨论】:

我要试试这个,看起来很适合我 :D 谢谢【参考方案7】:

我会看看JUNG。它实现了许多聚类算法,尽管我不确定 K-means 是否是其中之一。

另一个选择可能是查看Knime,这是一个基于 Eclipse 的工作流编辑器。这包括许多可用作工作流一部分的聚类原语,包括 K-means。

【讨论】:

对于那些感兴趣的人,JUNG 有 k-means 聚类:jung.sourceforge.net/doc/api/edu/uci/ics/jung/algorithms/util/…【参考方案8】:

Apache Mahout 通过 Hadoop 实现了许多集群算法。对于你想要的东西来说有点重,但是:http://cwiki.apache.org/MAHOUT/syntheticcontroldata.html

您还可以从 Mahout 的 TreeClusteringRecommender 类中挖掘和调整用户聚类代码,该类将聚类用于推荐引擎。

【讨论】:

我读过它。这是一个非常庞大和复杂的:(

以上是关于Java集群库[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

重启数据库集群服务器( 主库服务器/备库服务器 )步骤

Java支付网关库[关闭]

OAuth Provider 库(Java)[关闭]

集群共享缓存[关闭]

如何使用 Jedis 库建立与 Redis Sentinel 的连接? [关闭]

Java的UPnP库[关闭]