r 上的 H2o 随机森林图
Posted
技术标签:
【中文标题】r 上的 H2o 随机森林图【英文标题】:H2o random forest plot on r 【发布时间】:2016-11-10 22:15:07 【问题描述】:我是 h2o
的新手,我在 r 上使用这个包时遇到了困难。
我分别使用带有 18917 个变量和二进制目标 (0,1) 的训练和测试集 5100 和 2300 obs
我跑了一个随机森林:
train_h20<-as.h2o(train)
test_h20<-as.h2o(test)
forest <- h2o.randomForest(x = Words,
y = 18918,
training_frame = train_h20,
ntree = 250,
validation = test_h20,
seed = 8675309)
我知道我可以得到 logloss 或 mse 或 ... 随着树数变化的图 但是有没有办法绘制模型本身的图像。我的意思是用于最终预测的最终集成树?
另外,另一个问题,在randomForest
包中,我可以使用返回我的varImp
函数,以及绝对重要性、特定于类的度量(计算为准确度的平均下降),我解释为一个类- 变量重要性的相对度量。
varImp 矩阵,randomForest 包:
在h2o
包中,我只找到绝对重要性度量,有类似的吗?
【问题讨论】:
最好把你的两个问题当作两个问题来问。 (请参阅meta.stackexchange.com/a/39224/167713 了解原因。)H2O 没有随机森林图;我已经看到了阅读原始 POJO 输出的建议! (不管怎样,除了玩具模型,你不会想要这样做。) 【参考方案1】:在 R 中随机森林的末尾没有带有 randomForest 包的最终树。为了做出最终的预测,随机森林使用投票法。投票意味着,对于任何数据: 例如 0;
将数据预测为 0 类的树数/森林中的树总数
对于 1 类,它与 0 类相同;
将数据预测为第 1 类的树数/森林中的树总数
但是你可以使用 ctree。 图书馆(“派对”) x
【讨论】:
以上是关于r 上的 H2o 随机森林图的主要内容,如果未能解决你的问题,请参考以下文章
R语言基于h2o包构建二分类模型:使用h2o.randomForest构建随机森林模型使用h2o.auc计算模型的AUC值
R语言随机森林模型:计算随机森林模型的特征重要度(feature importance)并可视化特征重要度使用少数重要特征拟合随机森林模型(比较所有特征模型和重要特征模型在测试集上的表现差异)