R h2o.deeplearning 用分类模式获取概率
Posted
技术标签:
【中文标题】R h2o.deeplearning 用分类模式获取概率【英文标题】:R h2o.deeplearning obtaining probabilities with classification mode 【发布时间】:2019-08-16 05:29:54 【问题描述】:我正在使用 h2o.deeplearning 在分类任务上训练神经网络。
我有什么
Y ~ x1 + x2... 其中所有 x 变量都是连续的,Y 是二进制的。
我想要什么
能够训练深度学习对象来预测给定行是真还是假的概率。也就是说,预测值 (Y) 限制在 0 和 1 之间。
我尝试过的 当 Y 输入为数字(即 0 或 1)时,h2o 深度学习会自动将其视为回归问题。这很好,除了 NN 的最后一层是线性的,而不是 tanh,并且预测值可以大于 1 或小于 0。我一直无法找到让最后一层成为 tanh 的方法.
当 Y 输入为分类问题(即 TRUE 或 FALSE)时,h2o 深度学习会自动将其视为分类问题。它没有给出 Y 为 1 或 0 的期望概率,而是给出了 Y 是什么的最佳猜测。
有没有办法解决这个问题?技巧、调整或被忽视的参数?我在 h2o.deeplearning 文档中注意到一个“分布”参数,但没有关于它的用途的更多信息。我最好的猜测是它是某种与 GLM 相同的链接功能,但我不确定。
【问题讨论】:
好吧,你还没有提供任何代码。你没有提供任何数据。而且您还没有提供任何指向您已经研究过其文档的网站的链接,因此我们不知道您为此付出了多少努力。我想知道这是否更接近 stackexchange 的 beta 数据科学部分处理的主题? (别怪我,它们不是我的选票,所以这些只是对动机的猜测。) 【参考方案1】:如果您将问题视为二元分类问题,那么您不仅会得到 0 或 1 的“预测”,而且还会得到 p0 和 p1 的概率加起来为 1。这些是预测值为分别为负类和正类。
那直接用p1就好了。
【讨论】:
以上是关于R h2o.deeplearning 用分类模式获取概率的主要内容,如果未能解决你的问题,请参考以下文章