机器学习模型是不是可能具有低测试误差和高训练误差?

Posted

技术标签:

【中文标题】机器学习模型是不是可能具有低测试误差和高训练误差?【英文标题】:Is it possible to have low test error and high training error for a machine learning model?机器学习模型是否可能具有低测试误差和高训练误差? 【发布时间】:2019-12-20 16:20:18 【问题描述】:

当我们有大的测试误差和大的训练误差时,我们说这是一个 BIAS 问题。当我们有低训练错误和高测试错误时,我们说它是方差问题。当训练误差和测试误差都低到可以接受时,我们说它是 GOOD fit 或 BEST fit 模型。

但是有没有可能有更多的训练错误然后测试错误??? 如果是,那我们怎么说呢?? 此外,测试和训练集是随机选择的,因此无需进行先前的设置!

Training    Test    Model
error       error

low         low     GOOD FIT
low         high    HIGH VARIANCE
high        high    HIGH BIAS
high        low     ????????

【问题讨论】:

【参考方案1】:

由于学习模型旨在减少训练错误(因为测试集在学习时不可用,因此是“测试”),这是非常不可能的,我会说除非你专门创建一些发生这种情况的示例,否则不会发生。

要发生这种情况,训练集必须是高方差之一,或者与所选模型不兼容的模型(例如,分离无法线性分离的数据的线性模型)对于任何测试都会产生高训练误差设置为产生低训练误差,它必须不反映与给定训练集中相同的方差。如果遇到这样的问题,很可能是这些套装的构造不好。由于这种情况不太可能发生,我不知道它有什么名字

【讨论】:

以上是关于机器学习模型是不是可能具有低测试误差和高训练误差?的主要内容,如果未能解决你的问题,请参考以下文章

模型方差与偏差

机器学习(ML)七之模型选择欠拟合和过拟合

机器学习之一 模型评估及部分概念

机器学习之一 模型评估及部分概念

机器学习123模型评估与选择 (上)

学习笔记1:《机器学习》第二章 模型评估与选择