R线性回归模型构建:残差值回归值预测域置信区间
Posted Data+Science+Insight
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R线性回归模型构建:残差值回归值预测域置信区间相关的知识,希望对你有一定的参考价值。
R线性回归模型构建:残差值、回归值、预测域、置信区间
简单线性回归(simple linear-regression)是预测连续变量的最简单,最流行的技术。它的前提假设是:结果与预测变量之间存在线性关系。
线性回归的数学公式可以写成y = b0 + b1*x + e,其中:
- b0并b1称为回归beta系数或参数:
- b0是回归线的截距;是x = 0时y的预测值。
- b1是回归线的斜率,是与预测变量x相关的回归权重或系数。
e是误差项(也称为残差),是y中可以由回归曲线解释的部分。
下图说明了线性回归模型,其中:
- 最佳拟合回归线为蓝色
- 截距(b0)和斜率(b1)以绿色显示
- 误差项(e)用垂直红线表示
从上面的散点图可以看出,并不是所有的数据点都精确地落在拟合的回归线上。有些点在蓝色曲线的上方,有些在蓝色曲线的下方。总体而言,残余误差(e)的平均值约为零。
残差的平方和称为残差平方和(Residual Sum of Squares&#
以上是关于R线性回归模型构建:残差值回归值预测域置信区间的主要内容,如果未能解决你的问题,请参考以下文章