Java集群库[关闭]
Posted
技术标签:
【中文标题】Java集群库[关闭]【英文标题】:Java Clustering Library [closed] 【发布时间】:2011-01-08 21:54:40 【问题描述】:我正在寻找 java 中的轻量级聚类库。我不需要该库中的 100 个聚类算法,只需 5 到 7 个算法对我来说就可以了。
我敢肯定,您会问:“您需要什么样的算法以及用于什么目的”:)。我只需要在聚类的帮助下对我的数据进行分类。例如 K 表示。
P.S:我知道 weka,但我不想使用它,因为它不是专门用于集群的。
【问题讨论】:
集群是什么意思?是weka sth。给你? 对不起,我没有得到你的答案。什么是什么? 注意以备将来参考......在软件开发中,“集群”通常意味着en.wikipedia.org/wiki/Cluster_%28computing%29 @skaffman 不是真的,请参阅数据挖掘或en.wikipedia.org/wiki/Cluster_analysis @agazerboy ……意味着什么。 for weka 看看这里en.wikipedia.org/wiki/Weka_%28machine_learning%29 那么,您是指数据挖掘技术吗?啊,好吧,我读了你的编辑... 【参考方案1】:看看 Apache 的 Commons Math 库中的 org.apache.commons.math4.ml.clustering.KMeansPlusPlusClusterer。
【讨论】:
【参考方案2】:如果你想要一些Java中的基本聚类算法,可以查看我的软件:
http://www.philippe-fournier-viger.com/spmf/
它提供了 KMeans 和层次聚类算法的实现。
提供的其他算法用于模式挖掘。总共有 47 种算法。但只有 2 个用于聚类。另一件事:有一个用于启动算法的简单 GUI。
【讨论】:
【参考方案3】:如果 Scala 也适用于您,那么您可能需要在 Scala 中检查此版本的 KMeans:
https://github.com/wspringer/kmeans
相关的博文在这里:
http://nxt.flotsam.nl/k-means-clustering.html
【讨论】:
【参考方案4】:Cytoscape 软件有几个插件可以实现网络和数值数据的聚类算法(Nemo、MCODE、clusterMaker 等)。所有插件都是开源的。
【讨论】:
【参考方案5】:还有ELKI,一个类似于 WEKA 的开源大学项目,但侧重于聚类分析和异常值检测,而不是机器学习算法。 它相当先进,使用索引结构来提高效率,并且至少有十几种聚类算法。
【讨论】:
【参考方案6】:这里有一些 Java 中的开源集群算法,这些算法在 GPL 下可用。需要 Java Colt 库(用于矩阵)。 http://open.trickl.com/
【讨论】:
我要试试这个,看起来很适合我 :D 谢谢【参考方案7】:我会看看JUNG。它实现了许多聚类算法,尽管我不确定 K-means 是否是其中之一。
另一个选择可能是查看Knime,这是一个基于 Eclipse 的工作流编辑器。这包括许多可用作工作流一部分的聚类原语,包括 K-means。
【讨论】:
对于那些感兴趣的人,JUNG 有 k-means 聚类:jung.sourceforge.net/doc/api/edu/uci/ics/jung/algorithms/util/…【参考方案8】:Apache Mahout 通过 Hadoop 实现了许多集群算法。对于你想要的东西来说有点重,但是:http://cwiki.apache.org/MAHOUT/syntheticcontroldata.html
您还可以从 Mahout 的 TreeClusteringRecommender 类中挖掘和调整用户聚类代码,该类将聚类用于推荐引擎。
【讨论】:
我读过它。这是一个非常庞大和复杂的:(以上是关于Java集群库[关闭]的主要内容,如果未能解决你的问题,请参考以下文章