第五十篇 入门机器学习——线性回归(Linear Regression)
Posted xuezou
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第五十篇 入门机器学习——线性回归(Linear Regression)相关的知识,希望对你有一定的参考价值。
No.1. 线性回归算法的特点
No.2. 分类问题与回归问题的区别
No.6. 最小二乘法的"套路"
No.7. 实现一个简单线性规划
No.8. 将上述逻辑封装到一个SimpleLinearRegression1类中
No.9. 调用封装好的类
简单调用类SimpleLinearRegression2:
No.11. 简单测试for循环和向量化运算的性能差异
No.12. 衡量回归算法好坏的指标
No.13. 用sklearn提供的波士顿房价数据集来实际衡量一下回归算法的好坏
准备工作
查看数据集的描述信息
根据上面的信息,该数据集共有506个样本实例,每个样本共有13个特征
我们本次只测试简单线性回归,因此仅选取一个特征进行研究,选取‘RM‘,即房间数量这一特征
‘RM‘这个特征的索引为5,我们所选取的数据如下:
在上图中,纵坐标50的地方有很多点散列,这个很可能是数据上限造成的,我们需要剔除掉这些点。
No.14. 封装三种误差计算方法的业务逻辑如下:
简单调用测试一下:
No.15. 调用sklearn中的MSE和MAE
No.16. 最好的衡量线性回归的指标R Square
实际计算一下R Square
将其封装到一个函数中
调用一下:
No.17. 最后,再往自定义的SimpleLinearRegression类中添加一个score方法,可以直接获取预测准确率,完整的业务逻辑如下:
以上是关于第五十篇 入门机器学习——线性回归(Linear Regression)的主要内容,如果未能解决你的问题,请参考以下文章
机器学习TensorFlow/PyTorch/Sklearn实现的五十种机器学习模型
推荐|TensorFlow/PyTorch/Sklearn实现的五十种机器学习模型