H2O:GLM MOJO 模型的重要性不可变?
Posted
技术标签:
【中文标题】H2O:GLM MOJO 模型的重要性不可变?【英文标题】:H2O: GLM MOJO models doesn't hold variable importance? 【发布时间】:2020-10-27 15:47:29 【问题描述】:关于 h2o mojo 模型的问题。
GLM MOJO 模型对模型的重要性不可变,我的理解正确吗?
还是缺少什么?
当我从 GLM 模型中查询 varimp/varimp_plot 时,有时会在屏幕截图中收到以下消息。
“警告:此模型的重要性不可变。”
这很常见吗?而我们从生成它们的内核中的同一模型中获得 varimp。只是想了解一下。
任何线索将不胜感激。
【问题讨论】:
【参考方案1】:MOJO 模型是 H2O 将模型投入生产的主要方式。这些独立的 zip 文件主要是通过genmodel
运行而不是检查。 MOJO 模型不等于二进制模型,它与某个 H2O 版本相关联。原因很简单——算法参数和算法本身可能会因版本而异。
无论如何,H2O 提供了一种将 MOJO 导入回 H2O 并主要使用它们进行评分的方法。 MOJO 的一些属性仍然从 MOJO 中提取并提供给用户。但是,正如documentation 所说,不能保证公开了哪些模型参数,有些可能会丢失。 MOJO 模型导入是作为 H2O 的 Generic model
功能的一部分实现的 - H2O 能够“拥抱”任何模型,即使是在 H2O 之外训练的模型,只要“通用模型驱动程序”可用。
话虽如此,肯定有一种方法可以为 MOJO 导入功能用户提供可变重要性。这是一个已知问题,在H2O JIRA 中进行了跟踪。
my blog 上有关 MOJO 模型的更多资源。
【讨论】:
非常感谢您提供的信息,帕维尔。这有帮助。希望我们尽快得到修复它的更新。以上是关于H2O:GLM MOJO 模型的重要性不可变?的主要内容,如果未能解决你的问题,请参考以下文章
H2O 不应该标准化正则化 GLM 模型(套索、岭、弹性网)的分类预测变量吗?
R语言基于h2o包构建二分类模型:使用h2o.glm构建正则化的逻辑回归模型使用h2o.auc计算模型的AUC值
将 H2O.ai POJO/MOJO/API 与流行的 BI 工具一起使用