线性回归模型为啥要求随机误差的均值为0

Posted 2023-05-01

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了线性回归模型为啥要求随机误差的均值为0相关的知识，希望对你有一定的参考价值。

用概率来理解的话，随机误差有多个取值，这些取值关于零对称。对于同一个模型，当你的试验次数足够多，那么随即误差的每一个取值出现的概率是均等的，所以最终随机误差会相互抵消。

举例数学成绩和物理成绩的相关关系，假设数学成绩为90分时，利用回归方程算得应得的物理成绩是87分，但在你的统计过程中，有人考89分也有人考85分，其中误差绝对值相等。

相关如下

由于这两个分数出现的概率应该均等，所以当你统计的学生个数无限多时，这两个分数的频率也渐渐趋同，最终相互抵偿，均值为零。这个值不是数学计算出来的，是理论推理得到的，也可以算是人为规定吧。

首先是想用一个函数来拟合数据。但往往不能完美拟合。这时比较理想情况当然是偏多和偏少的一样多。这些偏差看作随机误差，当然要是0才最理想。

这里的0均值，并不是真实就是有0均值的随机误差，只是拟合的不完美导致的偏差。所以是人为的假设，而不是本来就有的。

参考技术A 1、随机误差项是一个期望值或平均值为0的随机变量;2、对于解释变量的所有观测值，随机误差项有相同的方差;3、随机误差项彼此不相关;4、解释变量是确定性变量，不是随机变量，与随机误差项彼此之间相互独立;5、解释变量之间不存在精确的(完全的)线性关系，即解释变量的样本观测值矩阵是满秩矩阵;6、随机误差项服从正态分布。本回答被提问者采纳参考技术B 如果均值不等于0，等式将会不可解。

如何用Python进行线性回归以及误差分析

线性回归：
设x,y分别为一组数据，代码如下
import matplotlib.pyplot as plt
import numpy as np
ro=np.polyfit(x,y,deg=1) #deg为拟合的多项式的次数（线性回归就选1）
ry=np.polyval(ro,x) #忘记x和ro哪个在前哪个在后了。。。
print ro #输出的第一个数是斜率k，第二个数是纵截距b
plt.scatter(x,y)
plt.plot(x,ry) 参考技术A 我也想知道

以上是关于线性回归模型为啥要求随机误差的均值为0的主要内容，如果未能解决你的问题，请参考以下文章

线性回归模型 为啥要求随机误差的均值为0

如何用Python进行线性回归以及误差分析

线性回归模型为啥要求随机误差的均值为0