类似于 h2o 包中排列精度重要性的东西

Posted

技术标签:

【中文标题】类似于 h2o 包中排列精度重要性的东西【英文标题】:something similar to permutation accuracy importance in h2o package 【发布时间】:2016-12-01 02:08:18 【问题描述】:

我用 R 中的 randomForest 包为我的多项目标拟合了一个随机森林。寻找变量重要性我发现了 permutation accuracy importance 这就是我要分析的内容。 我也用 h2o 包安装了一个随机森林,但它显示给我的唯一度量是relative_importance, scaled_importance, percentage

我的问题是:我可以提取一个指标来显示目标的水平,从而更好地分类我想在考试中参加的变量吗? Permutation accuracy importance 是我在这种情况下可以使用的最佳衡量标准吗?

例如:我有 3 个级别的目标:ABC 和 5 个变量:v1-v2-v3-v4-v5 是否有衡量标准表明 v1 对于目标的 A 级而不是 B 级更重要(类似于排列精度重要性的东西)?

【问题讨论】:

【参考方案1】:

虽然 h2o 没有通过 r/python api 提供 permutation accuracy importance(正如您指出的那样,它提供了可变重要性),但您可以使用 PDP h2o.partialPlot() 来查看功能中的各个级别如何影响目标。

【讨论】:

以上是关于类似于 h2o 包中排列精度重要性的东西的主要内容,如果未能解决你的问题,请参考以下文章

H2O R 变量重要性截断列表

h2o randomForest 变量重要性

是否可以从 h2o.automl 模型中获得特征重要性图?

在 h2o 随机森林中用于“重要性”的度量是啥

H2O:GLM MOJO 模型的重要性不可变?

r R脚本采用H2o模型权重和偏差,并通过NeuralNetTools旧的变量重要性函数发送它们......并且第一个ti