R中的随机森林 - 许多类
Posted
技术标签:
【中文标题】R中的随机森林 - 许多类【英文标题】:Random Forest in R - many classes 【发布时间】:2012-10-27 01:17:03 【问题描述】:我想用 R randomForest 进行多标签分类。 我有十个班 A..J,
我找到了如何预测单个类的示例,例如:
r = randomForest(J ~., data=train, importance=TRUE, do.trace=100)
但我想预测更多类,例如 H、I、J。 (即说只有 A..G 被赋予属性)。 我该怎么做?
我有一个保留 A..G 和仅一个预测类 (H/I/J) 并运行 randomForest 3 次的想法,但也许有更好的方法?一次性完成?
非常感谢。
【问题讨论】:
您的问题可能会更清楚。您是说您希望能够预测训练数据中不存在的类别吗?因为那会……很困难。 不,我的意思是我想将 7 列视为给定并预测其他 3 列的值。 我不知道多变量射频包(虽然可能是错误的......)。简单的事情就是适合三个模型。 【参考方案1】:假设所有属性 H、I 和 J 都是二元的。然后你可以用 2^3 个可能的值预测一个新属性 K,然后将结果解码回 3 个属性:
1 -> 0,0,0 2 -> 0,0,1 3 -> 0,1,0 4 -> 0,1,1 5 -> 1,0,0 6 -> 1,0,1 7 -> 1,1,0 8 -> 1,1,1【讨论】:
以上是关于R中的随机森林 - 许多类的主要内容,如果未能解决你的问题,请参考以下文章