预测(随机森林):概率或投票对回归没有意义

Posted

技术标签:

【中文标题】预测(随机森林):概率或投票对回归没有意义【英文标题】:Predict (Random Forest): prob or vote not meaningful for regression 【发布时间】:2014-07-24 21:10:47 【问题描述】:

当我运行预测函数时,我得到这个错误:

Error in predict.randomForest(fit, newdata = na.roughfix(csvTest[, -c(1:2,  : 
'prob' or 'vote' not meaningful for regression code here

这是代码:

fit <- foreach (ntree = rep (round(number_trees/nc), nc), 
            .combine = combine, .packages = 'randomForest') %dopar% randomForest(y=csv$mal,x=na.roughfix (csv[, c(1:2,4:5,8:13,17,19:20,22:29,ncol(csv))]), ntree = number_trees)
prob <- predict (fit, newdata = na.roughfix (csvTest[, -c(1:2,4:5,8:13,17,19:20,22:29,ncol(csvTest))]), type = 'prob')[, 2]

谁能帮我理解这是什么问题? 谢谢

【问题讨论】:

【参考方案1】:

我刚刚解决了。这是因为我的目标变量 (csv$mal) 默认被 R 设置为“数字”,而它应该是“因子”一(0 或 1)。

对于数字,随机森林以 type="regression" 运行,而不是 type="classification"。

【讨论】:

以上是关于预测(随机森林):概率或投票对回归没有意义的主要内容,如果未能解决你的问题,请参考以下文章

随机森林(分类与回归)

如何从回归随机森林中获得概率密度函数?

随机森林原理

R语言 | randomForest包的随机森林回归模型以及对重要变量的选择

pyspark 随机森林回归器预测多类

测量随机森林回归器中每个预测器特征重要性对目标值的影响(量化)(目标值的提升或下降)