将 mahout 随机森林分类输出转换为可读

Posted

技术标签:

【中文标题】将 mahout 随机森林分类输出转换为可读【英文标题】:convert mahout random forest classification output to readable 【发布时间】:2015-06-11 17:28:11 【问题描述】:

我正在通过 mahout 网站上的教程学习 mahout 随机森林: http://mahout.apache.org/users/classification/partial-implementation.html

但是当所有作业成功完成时,我的输出文件是这样的:

@1@.@0@

@1@.@0@

@0@.@0@

@1@.@0@

@1@.@0@

@0@.@0@

@0@.@0@

@0@.@0@

如何将其转换为人类可读的输出?

【问题讨论】:

不熟悉 mahout 但假设您可以在您的类中覆盖 toString 方法 【参考方案1】:

最后我发现这个数字是标签的代码。

我们可以将它们更改为标签。

在 TestForest.java 示例中的这段代码之后:

classifier.run();

得到结果:

double[][] results = classifier.getResults();

第二列是预测。使用此代码将其更改为标签:

Dataset dataset = Dataset.load(getConf(), datasetPath);
for (double[] res : results) 
    dataset.getLabelString(res[1]);

【讨论】:

以上是关于将 mahout 随机森林分类输出转换为可读的主要内容,如果未能解决你的问题,请参考以下文章

mahout 随机森林RF算法

Mahout实现的分类算法,两个例子,预测期望的目标变量

随机森林

如何将随机森林中的选定特征转换为新列表

决策树与随机森林

MATLAB-随机森林实现数据回归分析预测