R 中的随机森林 - 19 个预测变量,1 个因变量

Posted

技术标签:

【中文标题】R 中的随机森林 - 19 个预测变量,1 个因变量【英文标题】:Random Forest in R - 19 predictors, 1 dependent variable 【发布时间】:2018-12-22 08:58:13 【问题描述】:

我有一个数据框(宏),由一个因变量 (y) 和 19 个自变量或特征 (x) 组成。我想使用随机森林算法使用同一时期的 x 值预测最新的 y 变量(以蓝色突出显示)。

 Macro <- read.csv("Input.csv")
x <- Macro[1:13,3:21]  #training data
y <- Macro[1:13,2:2]  #dependent variable
t <- Macro[14:14,2:21]  #period I'd like to predict


rf <- randomForest(x,
                          y,
                          ntree=500,
                          importance=T)

 predict(rf ,t)

上面返回一个值,但我有一种非常强烈的感觉,我错误地接近随机森林并且没有真正使用正确的程序或代码。感谢您的帮助。

【问题讨论】:

如果你想在R 中获得关于随机森林的非常好的教程,Introduction to Statistical Learning with Applications in R 是免费提供的,第 8 章介绍了基于树的方法,包括使用 @ 中的 randomForest 包987654327@. 这不是一个格式正确的 SO 问题,但值得粗略的结构是正确的。您在 xy 上训练 randomForest,然后在新数据上使用 predict。您目前正在将您的森林保存为rf 并预测cross.sell.rf,因此显然有一些代码您没有向我们展示。 更正了 SO 问题 【参考方案1】:

这应该可行:

x

y

t

rf

预测(rf,t)

【讨论】:

以上是关于R 中的随机森林 - 19 个预测变量,1 个因变量的主要内容,如果未能解决你的问题,请参考以下文章

机器学习:R语言实现随机森林

r 随机森林错误 - 新数据中的预测变量类型不匹配

R中回归森林的特征选择和预测精度

将条件变量添加到 R 中的随机森林模型

R:如何使用随机森林来预测使用字符串变量的二进制结果?

R - 具有两个结果变量的随机森林