R 中的随机森林 - 19 个预测变量,1 个因变量
Posted
技术标签:
【中文标题】R 中的随机森林 - 19 个预测变量,1 个因变量【英文标题】:Random Forest in R - 19 predictors, 1 dependent variable 【发布时间】:2018-12-22 08:58:13 【问题描述】:我有一个数据框(宏),由一个因变量 (y) 和 19 个自变量或特征 (x) 组成。我想使用随机森林算法使用同一时期的 x 值预测最新的 y 变量(以蓝色突出显示)。
Macro <- read.csv("Input.csv")
x <- Macro[1:13,3:21] #training data
y <- Macro[1:13,2:2] #dependent variable
t <- Macro[14:14,2:21] #period I'd like to predict
rf <- randomForest(x,
y,
ntree=500,
importance=T)
predict(rf ,t)
上面返回一个值,但我有一种非常强烈的感觉,我错误地接近随机森林并且没有真正使用正确的程序或代码。感谢您的帮助。
【问题讨论】:
如果你想在R
中获得关于随机森林的非常好的教程,Introduction to Statistical Learning with Applications in R 是免费提供的,第 8 章介绍了基于树的方法,包括使用 @ 中的 randomForest
包987654327@.
这不是一个格式正确的 SO 问题,但值得粗略的结构是正确的。您在 x
和 y
上训练 randomForest
,然后在新数据上使用 predict
。您目前正在将您的森林保存为rf
并预测cross.sell.rf
,因此显然有一些代码您没有向我们展示。
更正了 SO 问题
【参考方案1】:
这应该可行:
宏
x
y
t
rf
预测(rf,t)
【讨论】:
以上是关于R 中的随机森林 - 19 个预测变量,1 个因变量的主要内容,如果未能解决你的问题,请参考以下文章