如何在实际项目中使用 mahout 随机森林?

Posted

技术标签:

【中文标题】如何在实际项目中使用 mahout 随机森林?【英文标题】:How to use mahout random forest in real project? 【发布时间】:2015-04-03 11:41:55 【问题描述】:

以下列表是 mahout-distribution-0.8 中与分类器相关的一些包。

org.apache.mahout.classifier org.apache.mahout.classifier.df org.apache.mahout.classifier.df.builder org.apache.mahout.classifier.df.data org.apache.mahout.classifier.df.data.conditions org.apache.mahout.classifier.df.mapreduce org.apache.mahout.classifier.df.mapreduce.inmem org.apache.mahout.classifier.df.mapreduce.partial org.apache.mahout.classifier.df.node org.apache.mahout.classifier.df.ref org.apache.mahout.classifier.df.split org.apache.mahout.classifier.df.tools

我猜上面提到的“df”是指“决策森林”。我不擅长 mahout,它的源代码让我抓狂,所以我想找一个 mahout 决策森林示例,看看如何使用这些包,就像第 7 章 Mahout 集群简介中的 HelloWorldClustering 代码一样。

我已经被这个问题困扰了一段时间。我在网上浏览了很多文章,但仍然没有找到一个有效的例子来告诉我如何在实际项目中编写代码。谁能给我一个代码示例?

【问题讨论】:

【参考方案1】:

我最近一直在使用 Mahout 的 DecisionForest,我发现最好的帮助资源是 Mark Needham 和 Jennifer Smith 的示例:

http://www.markhneedham.com/blog/2012/10/27/kaggle-digit-recognizer-mahout-random-forest-attempt/

看一下,GitHub存储库在页面底部。

【讨论】:

以上是关于如何在实际项目中使用 mahout 随机森林?的主要内容,如果未能解决你的问题,请参考以下文章

将 mahout 随机森林分类输出转换为可读

Mahout实现的分类算法,两个例子,预测期望的目标变量

如何更改 R 中随机森林的分割标准?

如何在 Weka GUI 中获取随机森林生成的树模型?

在 Java 中使用随机森林打印实际和预测的类标签

如何在 scikit-learn 中保存随机森林?