机器学习100天(二十三):023 欠拟合与过拟合

Posted 红色石头Will

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习100天(二十三):023 欠拟合与过拟合相关的知识,希望对你有一定的参考价值。

机器学习100天,今天讲的是欠拟合与过拟合!

《机器学习100天》完整目录:目录

一、过拟合与欠拟合

机器学习中,我们构建一个模型,通常可能会遇到欠拟合或者过拟合的问题。以这张图为例,面对同样一批数据,我们建立了 3 个不同的回归模型。左边这张图是简单的一次线性模型,中间这张图是二次多项式模型,右边这张图是复杂的高阶多项式模型。

直观上可以看到,左边的线性模型对数据拟合的效果一般,这种情况称之为欠拟合。什么是欠拟合呢?欠拟合就是是指模型不能在训练集上获得足够低的误差。换句换说,就是模型复杂度低,没法学习到数据背后的规律。

再来看右边的高阶多项式模型,它对数据拟合的非常好,好的有点过了,这种情况称之为过拟合。什么是过拟合呢?过拟合是指训练误差和测试误差之间的差距太大。换句换说,就是模型复杂度高于实际问题,模型在训练集上表现很好,但在测试集上却表现很差,即泛化能力差。

中间的二次多项式模型虽然在训练集上有些误差,但是却反应了数据分布的整体趋势,可以说是最好最合适的模型。

二、为什么发生过拟合

知道了欠拟合和过拟合的概念之后,我们来看为什么会发生欠拟合和过拟合。欠拟合主要是由于模型过于简单,选取的特

以上是关于机器学习100天(二十三):023 欠拟合与过拟合的主要内容,如果未能解决你的问题,请参考以下文章

机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合

Python机器学习及实践——进阶篇3(模型正则化之欠拟合与过拟合)

Python机器学习及实践——进阶篇3(模型正则化之欠拟合与过拟合)

欠拟合与过拟合

1.欠拟合与过拟合概念

机器学习之欠拟合和过拟合