r 上的 H2o 随机森林图

Posted

技术标签:

【中文标题】r 上的 H2o 随机森林图【英文标题】:H2o random forest plot on r 【发布时间】:2016-11-10 22:15:07 【问题描述】:

我是 h2o 的新手,我在 r 上使用这个包时遇到了困难。 我分别使用带有 18917 个变量和二进制目标 (0,1) 的训练和测试集 5100 和 2300 obs 我跑了一个随机森林:

train_h20<-as.h2o(train)
test_h20<-as.h2o(test)

forest <- h2o.randomForest(x = Words,
                           y = 18918,
                           training_frame = train_h20,
                           ntree = 250,
                           validation = test_h20,
                           seed = 8675309)

我知道我可以得到 logloss 或 mse 或 ... 随着树数变化的图 但是有没有办法绘制模型本身的图像。我的意思是用于最终预测的最终集成树?

另外,另一个问题,在randomForest 包中,我可以使用返回我的varImp 函数,以及绝对重要性、特定于类的度量(计算为准确度的平均下降),我解释为一个类- 变量重要性的相对度量。

varImp 矩阵,randomForest 包:

h2o 包中,我只找到绝对重要性度量,有类似的吗?

【问题讨论】:

最好把你的两个问题当作两个问题来问。 (请参阅meta.stackexchange.com/a/39224/167713 了解原因。)H2O 没有随机森林图;我已经看到了阅读原始 POJO 输出的建议! (不管怎样,除了玩具模型,你不会想要这样做。) 【参考方案1】:

在 R 中随机森林的末尾没有带有 randomForest 包的最终树。为了做出最终的预测,随机森林使用投票法。投票意味着,对于任何数据: 例如 0;

将数据预测为 0 类的树数/森林中的树总数

对于 1 类,它与 0 类相同;

将数据预测为第 1 类的树数/森林中的树总数

但是你可以使用 ctree。 图书馆(“派对”) x

【讨论】:

以上是关于r 上的 H2o 随机森林图的主要内容,如果未能解决你的问题,请参考以下文章

R语言基于h2o包构建二分类模型:使用h2o.randomForest构建随机森林模型使用h2o.auc计算模型的AUC值

h2o 随机森林中的排列重要性

在 h2o 随机森林中用于“重要性”的度量是啥

在 H2O 随机森林和 xgboost 中使用权重列

r语言随机森林结果规则怎么显示

R语言随机森林模型:计算随机森林模型的特征重要度(feature importance)并可视化特征重要度使用少数重要特征拟合随机森林模型(比较所有特征模型和重要特征模型在测试集上的表现差异)