spss进行线性回归分析时,相关系数都符合,但是显著性不符合,如何调整

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spss进行线性回归分析时,相关系数都符合,但是显著性不符合,如何调整相关的知识,希望对你有一定的参考价值。

线性回归时候,相关系数只是表明了各个系数之间的相关程度。但是自变量对因变量不显著的话,可能存在多重共线性、数据存在异常值、异方差的问题。

1、自变量存在共线性问题

在进行线性回归分析时,很容易出现自变量共线性问题,通常情况下VIF值大于10说明严重共线,VIF大于5则说明有共线性问题。当出现共线性问题时,可能导致回归系数的符号与实际情况完全相反,本应该显著的自变量不显著,本不显著的自变量却呈现出显著性。

解决方法:手动移除出共线性的自变量,先做下相关分析,如果发现某两个自变量X(解释变量)的相关系数值大于0.7,则移除掉一个自变量(解释变量),然后再做回归分析。逐步回归法,让软件自动进行自变量的选择剔除,逐步回归会将共线性的自变量自动剔除出去。

2、数据存在异常值,如果数据中存在极端异常值,会导致数据偏移对分析结果产生严重影响。如果回归分析出现各类异常,可通过比如描述分析、箱线图、散点图等方法,找出并处理掉异常值后再做分析。

解决方法:查看数据中是否有异常值,可通过箱线图、散点图查看,剔除异常值可通过SPSSAU“异常值”功能进行剔除。

3、异方差,如果模型存在明显的异方差性,会影响回归系数的显著情况,得到的回归模型是低效并且不稳定的。

解决方法:保存残差项,将残差项分别与模型的自变量X或者因变量Y,作散点图,查看散点是否有明显的规律性。如果有明显的异方差性,建议重新构建模型,比如对Y取对数后再次构建模型等。

如果排除了这些原因还是不显著,那么基本说明该变量对被解释变量无显著影响。

扩展资料

在做实证就是做回归等等方法的时候,一般就看中三点,一是相关系数,看因变量和自变量是否相关。二是拟合优度(R平方),看回归方程拟合的好不好,一般0.8以上就算拟合的比较好了。

三是自变量的系数对于因变量是否显著啦,P值小于0.05就说明自变量对于因变量是显著的。如果自变量的P值都比0.05大,那就说明自变量对于因变量是不显著的,这个自变量就没什么意义,所以如果变量比较多的情况下,还是做一下逐步回归。

如果变量比较少,做逐步回归就会导致最后有可能只剩下一个变量。逐步回归就是一个模型优化的过程,更加能解释自变量和因变量之间的关系,一般回归之后效果不好都要逐步回归来优化线性模型的。

参考技术A 你是想调整数据呢还是想调整什么呢?
线性回归时候,相关系数只是表明了各个系数之间的相关程度。但是自变量对因变量不显著的话,只能说明自变量多因变量影响不大,可以考虑换其他的跟因变量关系更加大的变量。或者在自变量多的情况下,用逐步回归的方法,提取出与因变量相关最大的自变量。追问

多谢你的回答!!!已经尝试换了很多数据可是就是不行,另外自变量与自变量之间有偏相关性说明什么问题能不能请问一下??线性回归分析做好的方法是逐步回归法吗??跪谢你的回答~~!!

追答

偏相关系数不能说明什么问题啊,我们在做实证就是做回归等等方法的时候,一般就看中三点,一是相关系数,看因变量和自变量是否相关。二是拟合优度(R平方),看回归方程拟合的好不好,一般0.8以上就算拟合的比较好了。三是自变量的系数对于因变量是否显著啦,P值小于0.05就说明自变量对于因变量是显著的。如果自变量的P值都比0.05大,那就说明自变量对于因变量是不显著的,这个自变量就没什么意义啦,所以如果变量比较多的情况下,还是做一下逐步回归吧,如果变量比较少,做逐步回归就会导致最后有可能只剩下一个变量。逐步回归就是一个模型优化的过程,更加能解释自变量和因变量之间的关系,一般回归之后效果不好都要逐步回归来优化你的线性模型的。

本回答被提问者采纳

spss回归分析结果解读

请问spss回归分析数据都是怎么看的,谢谢!
以payout(现金股利支付率)为自变
ROA

第一步:首先对模型整体情况进行分析

包括模型拟合情况(R²),是否通过F检验等。

第二步:分析X的显著性

分析X的显著性(P值),如果呈现出显著性,则说明X对Y有影响关系。如果不显著,则应剔除该变量。

第三步:判断X对Y的影响关系方向及影响程度

结合回归系数B值,对比分析X对Y的影响程度。B值为正数则说明X对Y有正向影响,为负数则说明有负向影响。

第四步:写出模型公式

第五步:对分析进行总结

SPSSAU也会提供智能分析建议,方便分析人员快速得出分析结果。

参考技术A 说明一下各个符号,constant的意思是常量,实际上就是回归方程的截距,也就是自变量为0时因变量的取值,如果你的方程是标准化的,且因变量是正态分布的,那么常量会变成0,也就是没有截距。B也就是beta,代表回归系数,标准化的回归系数代表自变量也就是预测变量和因变量的相关,为什么要标准化,因为标准化的时候各个自变量以及因变量的单位才能统一,使结果更精确,减少因为单位不同而造成的误差。T值就是对回归系数的t检验的结果,绝对值越大,sig就越小,sig代表t检验的显著性,在统计学上,sig<0.05一般被认为是系数检验显著,显著的意思就是你的回归系数的绝对值显著大于0,表明自变量可以有效预测因变量的变异,做出这个结论你有5%的可能会犯错误,即有95%的把握结论正确。
回归的检验首先看anova那个表,也就是F检验,那个表代表的是对你进行回归的所有自变量的回归系数的一个总体检验,如果sig<0.05,说明至少有一个自变量能够有效预测因变量,这个在写数据分析结果时一般可以不报告
然后看系数表,看标准化的回归系数是否显著,每个自变量都有一个对应的回归系数以及显著性检验
最后看模型汇总那个表,R方叫做决定系数,他是自变量可以解释的变异量占因变量总变异量的比例,代表回归方程对因变量的解释程度,报告的时候报告调整后的R方,这个值是针对自变量的增多会不断增强预测力的一个矫正(因为即使没什么用的自变量,只要多增几个,R方也会变大,调整后的R方是对较多自变量的惩罚),R可以不用管,标准化的情况下R也是自变量和因变量的相关
标准误表示由于抽样误差所导致的实际值和回归估计值的偏差大小,标准误越小,回归线的代表性越强
希望对您有用
参考技术B R=0.641,说明拟合效果还行,其概率小于0.05,说明方程系数不全为零;各个自变量sig.小于0.05的说明自变量对因变量有显著影响,影响正负你要看系数正负;相反,各个自变量sig.大于0.05的说明自变量对因变量无显著影响。追问

那请问那个F值表示了什么意思?

追答

F值表示什么不用理他,关键看F检验的sig.的大小,跟之前说的一样,概率小于0.05,说明方程系数不全为零。注意这里的系数不是一个变量的系数,是方程中所以变量的系数。不用看F值。

以上是关于spss进行线性回归分析时,相关系数都符合,但是显著性不符合,如何调整的主要内容,如果未能解决你的问题,请参考以下文章

SPSS的线性回归分析和Eviews的线性回归分析为啥差别那么大?

怎么用spss 具体步骤,做出回归系数和OR 和P 值

如何用R语言做线性相关回归分析

spss线性回归分析结果怎么看

怎样用SPSS做一元线性回归?具体怎么检验相关性

相关性分析