如何在 Hadoop Mapreduce 程序中使用机器学习算法?

Posted

技术标签:

【中文标题】如何在 Hadoop Mapreduce 程序中使用机器学习算法?【英文标题】:How do i use machine learning algorithms in Hadoop Mapreduce program? 【发布时间】:2015-11-27 10:42:30 【问题描述】:

如何在Hadoop Map-reduce 程序中使用机器学习算法? 我想使用分类算法、决策树、聚类算法。 除了 Mahout,请提出一些想法。

【问题讨论】:

【参考方案1】:

您可以编写自己的 MapReduce 程序,并在 mapper 和 reducer 中调用第三方机器学习算法。有几个开源机器学习库可用,如 Weka、open nlp、ctakes、mallet、uima 等...

另一种最佳方法是在 Hadoop 之上使用 Spark ML lib 或 H2O、Oryix

另一种解决方案:使用 PMML 和 JPMMLR、Weka、SAS 等机器学习工具与 Hadoop 集成。 您可以使用任何一种工具(R、SAS、Weka)开发模型,并在 JPMML 的帮助下在 MapReduce 程序中使用该模型。

【讨论】:

以上是关于如何在 Hadoop Mapreduce 程序中使用机器学习算法?的主要内容,如果未能解决你的问题,请参考以下文章

如何在Windows下面运行hadoop的MapReduce程序

如何在Windows下面运行hadoop的MapReduce程序

如何使用Python为Hadoop编写一个简单的MapReduce程序

如何使用 hadoop-2.2 在 oozie 中执行 mapreduce 程序

如何使用eclipse编写mapreduce程序

如何在 Hadoop Mapreduce 程序中使用机器学习算法?