机器学习基础2--评价回归模型

Posted redheat

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习基础2--评价回归模型相关的知识,希望对你有一定的参考价值。

技术分享图片

再次回到上一节的13次模型.

这个疯狂的曲线造成了一种现象过拟合.

很明显,你的房子不可能只值这么点价钱,所以看上去,这个13次模型甚至还不如一开始的二次模型.

技术分享图片

那么现在有个疑问,我们应该怎样去选择最合适的模型?

我们想要准确预测,但是我们无法观测未来.

下面我们模拟一次预测过程:

  1.我们随机将一些房子数据排除在外.

  2.然后拟合剩下的数据

  3.最后进行预测和推断.

技术分享图片

术语:

  训练集(training set):用来拟合模型的数据.

  测试集(test set):排除出去的数据.

训练损失(training error):训练集上的损失,就是训练集上的残差平方和.

技术分享图片

测试损失(test error):测试集上的损失,就是测试集上的残差平方和.

 技术分享图片

那么这两个?会起到什么作用?

我们以模型(线性模型,二次模型...十三次模型等)为X轴,损失为Y轴,绘制一个二维坐标系.

 技术分享图片

训练损失在不断降低的同时,测试损失竟然在某个点开始升高了!


技术分享图片

在这个点找到了一个和你房子大小相近的房子,你准备以此为参照.

但是你发现,这个房子只有一个卫生间,而你的房子是有3个的.

很明显,这个房子无法作为参照使用.

那么,我们把卫生间作为另一个特征,加入线性模型.

技术分享图片

X1为房屋面积,X2为卫生间数量,Y为价格.

那么,另外一些特征呢?

  卧室的数量

  位置

  ...

end


 

 

 课程:机器学习基础:案例研究(华盛顿大学)

 视频链接:https://www.coursera.org/learn/ml-foundations/home/welcome  

 week2 Evaluating regression models

以上是关于机器学习基础2--评价回归模型的主要内容,如果未能解决你的问题,请参考以下文章

机器学习:线性模型学习总结:逻辑回归分类

机器学习模型评价指标及拟合概念

机器学习:线性模型学习总结:基于PyTorch的线性模型

SIGAI机器学习第四集 基本概念

机器学习第二周-模型评价(I)

机器学习|正则化|评估方法|分类模型性能评价指标|吴恩达学习笔记