数据挖掘开源软件替代品[关闭]

Posted

技术标签:

【中文标题】数据挖掘开源软件替代品[关闭]【英文标题】:Datamining open source software alternatives [closed] 【发布时间】:2010-09-19 13:44:36 【问题描述】:

我正在评估数据挖掘包。 到目前为止,我已经找到了这两个:

RapidMiner Weka 您对这两个产品有什么经验可以分享,或者有什么其他产品可以推荐给我吗? 谢谢

【问题讨论】:

【参考方案1】:

根据 KDnuggets 2007、2008 和 2009 年的年度民意调查,RapidMiner 是全球数据挖掘专家中使用最广泛的开源数据挖掘解决方案: KDnuggets Data Mining Tool Poll 2009

RapidMiner 是开源的,并且 100% 使用 Java,RapidMiner 比 Weka 和 KNIME 更灵活,提供的功能也更多。

关于 SVM 实现:Weka 提供了一种这样的实现(LibSVM),而 RapidMiner 提供了四种 SVM 实现(LibSVM、MySVM、EvoSVM、SMO-SVM),其中一些具有更高级的功能。

【讨论】:

【参考方案2】:

另一种选择是Orange。它包括各种算法和数据挖掘技术,您可以通过 Python 脚本或 GUI 直接访问它们。

【讨论】:

【参考方案3】:

直接在 R 中重新发明***和代码!

【讨论】:

懒惰、急躁和狂妄为 +1。【参考方案4】:

Pentaho 非常适合商业智能。所以也许你想看看它。我在这方面有一些经验,主要是做数据仓库,还挺开心的。

【讨论】:

看来 Pentaho 是 Weka 的主要赞助商:weka.sf.net 不知道。也许我必须重新查看 Weka。【参考方案5】:

如果你对频繁模式挖掘、关联规则和顺序模式挖掘相关的Java代码感兴趣,我有一个小型的开源项目,有42种算法与这些主题相关:http://www.philippe-fournier-viger.com/spmf/

但是,请注意它不提供任何用户界面。但它提供了一些您在其他数据挖掘包中找不到的非常专业的算法。

【讨论】:

【参考方案6】:

我在高中课程中使用过 Weka,它有一个很好的 SVM 实现。这是四五年前的事了。

【讨论】:

【参考方案7】:

(KNIME ) 是相当广泛的数据挖掘平台。

【讨论】:

【参考方案8】:

根据 2011 年 KDnuggets 民意调查,RapidMiner 再次成为全球使用最广泛的数据挖掘解决方案: http://www.kdnuggets.com/2011/05/tools-used-analytics-data-mining.html

【讨论】:

【参考方案9】:

看看ELKI,它就像 WEKA,只是它在聚类和异常值检测方面要强得多,而 WEKA 本质上只能很好地进行分类。

【讨论】:

【参考方案10】:

如前所述,Pentaho 是 WEKA 所属的强大的商业智能套件。

所以我也推荐 Weka,只是为了你有一个很好的解决方案来扩展你的应用程序和一个很棒的社区。​​p>

【讨论】:

以上是关于数据挖掘开源软件替代品[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

像 Pay-Per-Click、Google Adwords 这样的开源软件? [关闭]

什么是用于 SMS 网关的 Kannel 的良好开源替代品? [关闭]

Kafka Confluent HTTP Sink Connector 的开源替代方案 [关闭]

Reflector 的开源替代品? [关闭]

codahale 的“指标”的其他开源替代品? [关闭]

mobiscroll的开源替代品[关闭]