线性回归模型 为啥要求随机误差的均值为0
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了线性回归模型 为啥要求随机误差的均值为0相关的知识,希望对你有一定的参考价值。
用概率来理解的话,随机误差有多个取值,这些取值关于零对称。对于同一个模型,当你的试验次数足够多,那么随即误差的每一个取值出现的概率是均等的,所以最终随机误差会相互抵消。
举例数学成绩和物理成绩的相关关系,假设数学成绩为90分时,利用回归方程算得应得的物理成绩是87分,但在你的统计过程中,有人考89分也有人考85分,其中误差绝对值相等。
相关如下
由于这两个分数出现的概率应该均等,所以当你统计的学生个数无限多时,这两个分数的频率也渐渐趋同,最终相互抵偿,均值为零。这个值不是数学计算出来的,是理论推理得到的,也可以算是人为规定吧。
首先是想用一个函数来拟合数据。但往往不能完美拟合。这时比较理想情况当然是偏多和偏少的一样多。这些偏差看作随机误差,当然要是0才最理想。
这里的0均值,并不是真实就是有0均值的随机误差,只是拟合的不完美导致的偏差。所以是人为的假设,而不是本来就有的。
参考技术A 1、随机误差项是一个期望值或平均值为0的随机变量;2、对于解释变量的所有观测值,随机误差项有相同的方差;3、随机误差项彼此不相关;4、解释变量是确定性变量,不是随机变量,与随机误差项彼此之间相互独立;5、解释变量之间不存在精确的(完全的)线性关系,即解释变量的样本观测值矩阵是满秩矩阵;6、随机误差项服从正态分布。本回答被提问者采纳 参考技术B 如果均值不等于0,等式将会不可解。如何用Python进行线性回归以及误差分析
线性回归:设x,y分别为一组数据,代码如下
import matplotlib.pyplot as plt
import numpy as np
ro=np.polyfit(x,y,deg=1) #deg为拟合的多项式的次数(线性回归就选1)
ry=np.polyval(ro,x) #忘记x和ro哪个在前哪个在后了。。。
print ro #输出的第一个数是斜率k,第二个数是纵截距b
plt.scatter(x,y)
plt.plot(x,ry) 参考技术A 我也想知道
以上是关于线性回归模型 为啥要求随机误差的均值为0的主要内容,如果未能解决你的问题,请参考以下文章