对于既不是分类也不是回归的事物,正确的术语是啥?

Posted

技术标签:

【中文标题】对于既不是分类也不是回归的事物,正确的术语是啥?【英文标题】:What's the correct terminology for something that isn't quite classification nor regression?对于既不是分类也不是回归的事物,正确的术语是什么? 【发布时间】:2011-03-01 01:37:06 【问题描述】:

假设我有一个基本上是分类的问题。也就是说,给定一些输入和一些可能的输出类,为给定的输入找到正确的类。神经网络和决策树是可用于解决此类问题的一些算法。然而,这些算法通常只发出一个结果:结果分类。

现在,如果我不仅对一个分类感兴趣,而且对输入属于每个类的后验概率感兴趣。即,我想要的答案不是“此输入属于 A 类”,而是“此输入属于 A 类,占 80%,B 类占 15%,C 类占 5%”。

我的问题不是关于如何获得这些后验概率,而是关于描述找到它们的过程的正确术语。你可以称之为回归,因为我们现在正试图估计一些实数值,但我不太确定这是否正确。我觉得这也不完全是分类,它介于两者之间。

是否有一个词描述了查找某个输入属于每个可能的输出类的类条件后验概率的过程?

附:我不确定这个问题是否足以成为一个编程问题,但由于它是关于机器学习的,而机器学习通常涉及大量的编程,让我们试一试。

【问题讨论】:

【参考方案1】:

“后验概率估计”对我来说听起来很合适。

【讨论】:

我同意并且已经考虑过了,不过我希望能更简洁一些... 这有点笨拙,但“后验估计”听起来像是一个肮脏笑话的妙语。 我可能会选择“计算后验概率”或“后验概率计算”。你并没有真正估计它。给定您的模型、数据和先验,您计算的只有一个后验。在一些简单的情况下,您将获得一个封闭形式的解决方案。如果你不这样做,那么你用来计算所有积分的计算工具——MCMC 或其他任何东西——并不能真正进行估计。最后你说“后验概率是”而不是“后验概率估计是”。 @Tristan 我会说你正在估计后验,你会说你正在计算模型、数据和先验条件的后验。我认为最终,这种区别会变成哲学上的。 我不喜欢说海报概率估计,因为它让我认为后验概率本身具有标准误差或后验分布。这不是真的,p 的后验分布描述了问题中的所有不确定性。不过,这只是一个很小的区别。【参考方案2】:

通常,计算条件后验分布的过程称为“推断”,因此您可以说您是“推断后验类分布”。

【讨论】:

【参考方案3】:

“多分类评估概率”怎么样?

无耻地从这里的参考部分摘录: http://en.wikipedia.org/wiki/Class_membership_probabilities

【讨论】:

以上是关于对于既不是分类也不是回归的事物,正确的术语是啥?的主要内容,如果未能解决你的问题,请参考以下文章

机器学习系列 - 3. 数据预处理

统计学习笔记之逻辑回归

引用实例时正确的术语是啥?

使用回归而不是分类进行多类分类

术语:DML“修改事物”

5.线性回归算法