如何检验回归系数是不是显著

Posted 2023-05-10

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何检验回归系数是不是显著相关的知识，希望对你有一定的参考价值。

参考技术A 回归方程及回归系数的显著性检验

1、回归方程的显著性检验

(1) 回归平方和与剩余平方和

建立回归方程以后, 回归效果如何呢？因变量与自变量是否确实存在线性关系呢？这是需要进行统计检验才能加以肯定或否定, 为此, 我们要进一步研究因变量取值的变化规律。的每次取值是有波动的, 这种波动常称为变差, 每次观测值的变差大小, 常用该次观侧值与次观测值的平均值的差(称为离差)来表示, 而全部次观测值的总变差可由总的离差平方和

,

其中:

称为回归平方和, 是回归值与均值之差的平方和, 它反映了自变量的变化所引起的的波动, 其自由度(为自变量的个数)。

称为剩余平方和(或称残差平方和), 是实测值与回归值之差的平方和, 它是由试验误差及其它因素引起的, 其自由度。总的离差平方和的自由度为。

如果观测值给定, 则总的离差平方和是确定的, 即是确定的, 因此大则小, 反之, 小则大, 所以与都可用来衡量回归效果, 且回归平方和越大则线性回归效果越显著, 或者说剩余平方和越小回归效果越显著, 如果＝0, 则回归超平面过所有观测点; 如果大, 则线性回归效果不好。

(2) 复相关系数

为检验总的回归效果, 人们也常引用无量纲指标

, (3.1)

或

, (3.2)

称为复相关系数。因为回归平方和实际上是反映回归方程中全部自变量的“方差贡献”, 因此就是这种贡献在总回归平方和中所占的比例, 因此表示全部自变量与因变量的相关程度。显然。复相关系数越接近1, 回归效果就越好, 因此它可以作为检验总的回归效果的一个指标。但应注意, 与回归方程中自变量的个数及观测组数有关, 当相对于并不很大时, 常有较大的值, 因此实际计算中应注意与的适当比例, 一般认为应取至少为的5到10倍为宜。

(3) 检验

要检验与是否存在线性关系, 就是要检验假设

, (3.3)

当假设成立时, 则与无线性关系, 否则认为线性关系显著。检验假设应用统计量, (3.4)

这是两个方差之比, 它服从自由度为及的分布, 即

, (3.5)

用此统计量可检验回归的总体效果。如果假设成立, 则当给定检验水平α下, 统计量应有

≤, (3.6)

对于给定的置信度α, 由分布表可查得的值, 如果根据统计量算得的值为, 则拒绝假设, 即不能认为全部为O, 即个自变量的总体回归效果是显著的, 否则认为回归效果不显著。

利用检验对回归方程进行显著性检验的方法称为方差分析。上面对回归效果的讨论可归结于一个方差分析表中, 如表3.1。

表3.1 方差分析表

来源

平方和

自由度

方差

方差比

回归

剩余

总计

根据与的定义, 可以导出与的以下关系:

,

。

利用这两个关系式可以解决值多大时回归效果才算是显著的问题。因为对给定的检验水平α, 由分布表可查出的临界值, 然后由即可求出的临界值:

, (3.7)

当时, 则认为回归效果显著。
例3.1 利用方差分析对例2.1的回归方程进行显著性检验。

方差分析结果见表3.2。

表3.2

来源

平方和

自由度

方差

方差比

回归

剩余

总计

取检验水平α＝0.05, 查分布表得, 而, 所以例2.1的回归方程回归效果是显著的。

2、回归系数的显著性检验

前面讨论了回归方程中全部自变量的总体回归效果, 但总体回归效果显著并不说明每个自变量对因变量都是重要的, 即可能有某个自变量对并不起作用或者能被其它的的作用所代替, 因此对这种自变量我们希望从回归方程中剔除, 这样可以建立更简单的回归方程。显然某个自变量如果对作用不显著, 则它的系数就应取值为0, 因此检验每个自变量是否显著, 就要检验假设:, , (3.8)

(1) 检验:

在假设下, 可应用检验:

, , (3.9)

其中为矩阵的对角线上第个元素。

对给定的检验水平α, 从分布表中可查出与α对应的临界值, 如果有, 则拒绝假设, 即认为与0有显著差异, 这说明对有重要作用不应剔除; 如果有则接受假设, 即认为成立, 这说明对不起作用, 应予剔除。

(2) 检验:

检验假设, 亦可用服从自由度分别为1与的分布的统计量

, (3.10)

其中为矩阵的主对角线上第个元素。对于给定的检验水平α, 从分布表中可查得临界, 如果有, 则拒绝假设, 认为对有重要作用。如果, 则接受假设, 即认为自变量对不起重要作用, 可以剔除。一般一次检验只剔除一个自变量, 且这个自变量是所有不显著自变量中值最小者, 然后再建立回归方程, 并继续进行检验, 直到建立的回归方程及各个自变量均显著为止。

最后指出, 上述对各自变量进行显著性检验采用的两种统计量与实际上是等价的, 因为由(3.9)式及(3.10)式知, 有

(3.11)

例3.2 对例2.1的回归方程各系数进行显著性检验。

经计算:

,

于是

,

其中＝0.002223, ＝0.004577。由(3.7)式知

,

,

查分布表得, , 因为, , 所以两个自变量及都是显著的。又由, 说明体长比胸围对体重的影响更大。

如果应用检验, 查分布表有, 又由

,

,

因为, , 因此及都是显著的, 均为重要变量, 应保留在回归方程中。

(3) 偏回归平方和

检验某一自变量是否显著, 还可应用偏回归平方和进行检验。

个自变量的回归平方和为

,

如果自个自变量中去掉, 则剩下的个自变量的回归平方和设为, 并设

,

则就表示变量在回归平方和中的贡献, 称为的偏回归平方和或贡献。可以证明
偏回归平方和越大, 说明在回归方程中越重要, 对的作用和影响越大, 或者说对回归方程的贡献越大。因此偏回归平方和也是用来衡量每个自变量在回归方程中作用大小(贡献大小)的一个指标。

例如在例2.1中, 和的偏回归平方和分别为

,

,

, 说明在回归方程中的作用比大。

又如在例2.2中及的偏回归平方和分别为:

,

,

,

,

的值最小, 即在回归方程中所起的作用最小, 最大, 说明在回归方程中所起的作用最大。
, (3.12)

SPSS 多元线性回归结果中，系数模型下的1，B，t，Sig.分别啥意思。在线等！！急求高手解答！！

SPSS 多元线性回归结果中，结果表格列出了自变量的显著性检验结果，结果输出表格中列出了回归模型的偏回归系数（B）及其标准误（Std.Error），标准化偏回归系数（Beta），回归系数检验的t统计量及其P值（Sig.）。

系数模型下的1表示模型的序号。

1、T表示使用单样本T检验的T值。

2、sig表示T检验的显著性检验P值，小于0.05的则说明自变量对因变量具有显著影响。

3、B表示各个自变量在回归方程中的偏回归系数，负值表示自变量对因变量有显著的负向影响。

扩展资料：

由于每个自变量的量纲和取值范围不同，基于偏回归系数B并不能反映各个自变量对因变量影响程度的大小。标准化偏回归系数其意义在于通过对偏回归系数进行标准化，从而可以比较不同自变量对因变量的作用大小。标准化偏回归系数数值越大表示对自变量的影响更大。

参考资料：

百度百科——偏回归系数

百度百科——t检验

百度百科——P值（sig）

参考技术A 标准化系数就是无量纲化之后的回归分析结果，就是把数据中心化再除以数据的标准差，目的是去掉数据的量纲（就是单位）然后可以对单位不同的东西做出回归分析，例如身高和体重

非标准化就是没干这个事情的

t就是t检验的结果

sig就是t检验的显著性，表示这一个自变量对因变量是否有影响，p<.05就显著说明有影响，越小越好，其实就是凡第一类错误的概率。

std. error自己百度百科讲得比我清楚参考技术B 1代表步骤，b的系数，t是个检验的统计量，sig是p值，小于0.05，说明这个系数不为0.
你这个都不知道，怎么做出来的？找本教材？追问

t的解释能更详细且符合发表要求么。编辑部要求注释t的意思。
我是否可以这样解释：B表示样本回归系数；t表示用T检验法对方程进行假设检验以说明其有无统计学意义的t值；Si.表示差异的显著性。

谢谢大侠！！

追答

可以这么说的

本回答被提问者采纳

以上是关于如何检验回归系数是不是显著的主要内容，如果未能解决你的问题，请参考以下文章