R中的随机森林 - 许多类

Posted

技术标签:

【中文标题】R中的随机森林 - 许多类【英文标题】:Random Forest in R - many classes 【发布时间】:2012-10-27 01:17:03 【问题描述】:

我想用 R randomForest 进行多标签分类。 我有十个班 A..J,

我找到了如何预测单个类的示例,例如:

r = randomForest(J ~., data=train, importance=TRUE, do.trace=100)

但我想预测更多类,例如 H、I、J。 (即说只有 A..G 被赋予属性)。 我该怎么做?

我有一个保留 A..G 和仅一个预测类 (H/I/J) 并运行 randomForest 3 次的想法,但也许有更好的方法?一次性完成?

非常感谢。

【问题讨论】:

您的问题可能会更清楚。您是说您希望能够预测训练数据中不存在的类别吗?因为那会……很困难。 不,我的意思是我想将 7 列视为给定并预测其他 3 列的值。 我不知道多变量射频包(虽然可能是错误的......)。简单的事情就是适合三个模型。 【参考方案1】:

假设所有属性 H、I 和 J 都是二元的。然后你可以用 2^3 个可能的值预测一个新属性 K,然后将结果解码回 3 个属性:

1 -> 0,0,0 2 -> 0,0,1 3 -> 0,1,0 4 -> 0,1,1 5 -> 1,0,0 6 -> 1,0,1 7 -> 1,1,0 8 -> 1,1,1

【讨论】:

以上是关于R中的随机森林 - 许多类的主要内容,如果未能解决你的问题,请参考以下文章

r中随机森林的类重要性

随机森林中的错误:“需要至少两个类来进行分类”

R中的随机森林交叉验证

机器学习:R语言实现随机森林

[ML]随机森林

将条件变量添加到 R 中的随机森林模型