H2O：GLM MOJO 模型的重要性不可变？

Posted 2023-03-12

技术标签:

【中文标题】H2O：GLM MOJO 模型的重要性不可变？【英文标题】：H2O: GLM MOJO models doesn't hold variable importance? 【发布时间】：2020-10-27 15:47:29 【问题描述】：

关于 h2o mojo 模型的问题。

GLM MOJO 模型对模型的重要性不可变，我的理解正确吗？

还是缺少什么？

当我从 GLM 模型中查询 varimp/varimp_plot 时，有时会在屏幕截图中收到以下消息。

“警告：此模型的重要性不可变。”

这很常见吗？而我们从生成它们的内核中的同一模型中获得 varimp。只是想了解一下。

任何线索将不胜感激。

【问题讨论】：

【参考方案1】：

MOJO 模型是 H2O 将模型投入生产的主要方式。这些独立的 zip 文件主要是通过genmodel 运行而不是检查。 MOJO 模型不等于二进制模型，它与某个 H2O 版本相关联。原因很简单——算法参数和算法本身可能会因版本而异。

无论如何，H2O 提供了一种将 MOJO 导入回 H2O 并主要使用它们进行评分的方法。 MOJO 的一些属性仍然从 MOJO 中提取并提供给用户。但是，正如documentation 所说，不能保证公开了哪些模型参数，有些可能会丢失。 MOJO 模型导入是作为 H2O 的 Generic model 功能的一部分实现的 - H2O 能够“拥抱”任何模型，即使是在 H2O 之外训练的模型，只要“通用模型驱动程序”可用。

话虽如此，肯定有一种方法可以为 MOJO 导入功能用户提供可变重要性。这是一个已知问题，在H2O JIRA 中进行了跟踪。

my blog 上有关 MOJO 模型的更多资源。

【讨论】：

非常感谢您提供的信息，帕维尔。这有帮助。希望我们尽快得到修复它的更新。

以上是关于H2O：GLM MOJO 模型的重要性不可变？的主要内容，如果未能解决你的问题，请参考以下文章

H2O 不应该标准化正则化 GLM 模型（套索、岭、弹性网）的分类预测变量吗？

R语言基于h2o包构建二分类模型：使用h2o.glm构建正则化的逻辑回归模型使用h2o.auc计算模型的AUC值

将 H2O.ai POJO/MOJO/API 与流行的 BI 工具一起使用

如何将模型 (GLM) 从 h2o 移植到 scikit-learn？

通过分类变量级别估计 h2o glm 系数

h2o 随机森林中的排列重要性