R h2o.deeplearning 用分类模式获取概率

Posted

技术标签:

【中文标题】R h2o.deeplearning 用分类模式获取概率【英文标题】:R h2o.deeplearning obtaining probabilities with classification mode 【发布时间】:2019-08-16 05:29:54 【问题描述】:

我正在使用 h2o.deeplearning 在分类任务上训练神经网络。

我有什么

Y ~ x1 + x2... 其中所有 x 变量都是连续的,Y 是二进制的。

我想要什么

能够训练深度学习对象来预测给定行是真还是假的概率。也就是说,预测值 (Y) 限制在 0 和 1 之间。

我尝试过的 当 Y 输入为数字(即 0 或 1)时,h2o 深度学习会自动将其视为回归问题。这很好,除了 NN 的最后一层是线性的,而不是 tanh,并且预测值可以大于 1 或小于 0。我一直无法找到让最后一层成为 tanh 的方法.

当 Y 输入为分类问题(即 TRUE 或 FALSE)时,h2o 深度学习会自动将其视为分类问题。它没有给出 Y 为 1 或 0 的期望概率,而是给出了 Y 是什么的最佳猜测。

有没有办法解决这个问题?技巧、调整或被忽视的参数?我在 h2o.deeplearning 文档中注意到一个“分布”参数,但没有关于它的用途的更多信息。我最好的猜测是它是某种与 GLM 相同的链接功能,但我不确定。

【问题讨论】:

好吧,你还没有提供任何代码。你没有提供任何数据。而且您还没有提供任何指向您已经研究过其文档的网站的链接,因此我们不知道您为此付出了多少努力。我想知道这是否更接近 stackexchange 的 beta 数据科学部分处理的主题? (别怪我,它们不是我的选票,所以这些只是对动机的猜测。) 【参考方案1】:

如果您将问题视为二元分类问题,那么您不仅会得到 0 或 1 的“预测”,而且还会得到 p0 和 p1 的概率加起来为 1。这些是预测值为分别为负类和正类。

那直接用p1就好了。

【讨论】:

以上是关于R h2o.deeplearning 用分类模式获取概率的主要内容,如果未能解决你的问题,请参考以下文章

获取 R 中 rpart/ctree 包的每一行预测数据集的决策树规则/路径模式

扩增子分析解读7物种分类统计 筛选进化树和其它

基于Tableau构建朴素贝叶斯分类器(无需R/Py)

怎么用R语言建立有序三分类logistic模型

如何用r语言进行数据分类

数值分类器 (?) Weka / R