H2O:GLM MOJO 模型的重要性不可变?

Posted

技术标签:

【中文标题】H2O:GLM MOJO 模型的重要性不可变?【英文标题】:H2O: GLM MOJO models doesn't hold variable importance? 【发布时间】:2020-10-27 15:47:29 【问题描述】:

关于 h2o mojo 模型的问题。

GLM MOJO 模型对模型的重要性不可变,我的理解正确吗?

还是缺少什​​么?

当我从 GLM 模型中查询 varimp/varimp_plot 时,有时会在屏幕截图中收到以下消息。

“警告:此模型的重要性不可变。”

这很常见吗?而我们从生成它们的内核中的同一模型中获得 varimp。只是想了解一下。

任何线索将不胜感激。

【问题讨论】:

【参考方案1】:

MOJO 模型是 H2O 将模型投入生产的主要方式。这些独立的 zip 文件主要是通过genmodel 运行而不是检查。 MOJO 模型不等于二进制模型,它与某个 H2O 版本相关联。原因很简单——算法参数和算法本身可能会因版本而异。

无论如何,H2O 提供了一种将 MOJO 导入回 H2O 并主要使用它们进行评分的方法。 MOJO 的一些属性仍然从 MOJO 中提取并提供给用户。但是,正如documentation 所说,不能保证公开了哪些模型参数,有些可能会丢失。 MOJO 模型导入是作为 H2O 的 Generic model 功能的一部分实现的 - H2O 能够“拥抱”任何模型,即使是在 H2O 之外训练的模型,只要“通用模型驱动程序”可用。

话虽如此,肯定有一种方法可以为 MOJO 导入功能用户提供可变重要性。这是一个已知问题,在H2O JIRA 中进行了跟踪。

my blog 上有关 MOJO 模型的更多资源。

【讨论】:

非常感谢您提供的信息,帕维尔。这有帮助。希望我们尽快得到修复它的更新。

以上是关于H2O:GLM MOJO 模型的重要性不可变?的主要内容,如果未能解决你的问题,请参考以下文章

H2O 不应该标准化正则化 GLM 模型(套索、岭、弹性网)的分类预测变量吗?

R语言基于h2o包构建二分类模型:使用h2o.glm构建正则化的逻辑回归模型使用h2o.auc计算模型的AUC值

将 H2O.ai POJO/MOJO/API 与流行的 BI 工具一起使用

如何将模型 (GLM) 从 h2o 移植到 scikit-learn?

通过分类变量级别估计 h2o glm 系数

h2o 随机森林中的排列重要性