机器学习中样本预测的可能性

Posted

技术标签:

【中文标题】机器学习中样本预测的可能性【英文标题】:Likelihood of a sample prediction in machine learning 【发布时间】:2017-11-05 19:07:49 【问题描述】:

我知道一些机器学习算法可以输出输入样本的预测标签概率。

例如,给一个样本有三个可能的标签,通过一些概率学习算法,例如逻辑回归或概率估计树,可以输出一个概率元组(0.2,0.3,0.5)。然后输出概率最大(这里为 0.5)的标签作为最终预测。

我的问题是,给定一个具有预测概率元组 (0.3,0.4,0.3) 的新样本,我如何定量确定预测标签(这里是第二个标签)正确的可能性?

非常感谢

【问题讨论】:

【参考方案1】:

(恕我直言,这个问题不属于这里。它确实属于统计堆栈交换)

答案非常简单:概率/可能性——不完全相同——是0.4,非常低。

如果你想运行一个小实验。构建/学习模型对几个实例进行分类并将其与基本事实进行比较。另外总结最可能标签的概率。您将看到概率总和与正确分类实例的比例相匹配 或:

    您的模型错误

    您的样本集太小

【讨论】:

以上是关于机器学习中样本预测的可能性的主要内容,如果未能解决你的问题,请参考以下文章

机器学习主要术语

机器学习之利用KNN近邻算法预测数据

构建决策树回归模型并预测样本的输出 - 机器学习

理论机器学习

机器学习笔记

机器学习中的训练数据不平衡问题