机器学习模型是不是可能具有低测试误差和高训练误差?
Posted
技术标签:
【中文标题】机器学习模型是不是可能具有低测试误差和高训练误差?【英文标题】:Is it possible to have low test error and high training error for a machine learning model?机器学习模型是否可能具有低测试误差和高训练误差? 【发布时间】:2019-12-20 16:20:18 【问题描述】:当我们有大的测试误差和大的训练误差时,我们说这是一个 BIAS 问题。当我们有低训练错误和高测试错误时,我们说它是方差问题。当训练误差和测试误差都低到可以接受时,我们说它是 GOOD fit 或 BEST fit 模型。
但是有没有可能有更多的训练错误然后测试错误??? 如果是,那我们怎么说呢?? 此外,测试和训练集是随机选择的,因此无需进行先前的设置!
Training Test Model
error error
low low GOOD FIT
low high HIGH VARIANCE
high high HIGH BIAS
high low ????????
【问题讨论】:
【参考方案1】:由于学习模型旨在减少训练错误(因为测试集在学习时不可用,因此是“测试”),这是非常不可能的,我会说除非你专门创建一些发生这种情况的示例,否则不会发生。
要发生这种情况,训练集必须是高方差之一,或者与所选模型不兼容的模型(例如,分离无法线性分离的数据的线性模型)对于任何测试都会产生高训练误差设置为产生低训练误差,它必须不反映与给定训练集中相同的方差。如果遇到这样的问题,很可能是这些套装的构造不好。由于这种情况不太可能发生,我不知道它有什么名字
【讨论】:
以上是关于机器学习模型是不是可能具有低测试误差和高训练误差?的主要内容,如果未能解决你的问题,请参考以下文章