SPSS数据分析—最优尺度回归
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SPSS数据分析—最优尺度回归相关的知识,希望对你有一定的参考价值。
在之前介绍的线性回归模型中,有一个隐含的假设是自变量均为连续变量,但实际上自变量有时候是分类变量,类似于方差分析中的因素,这种分类自变量在回归分析中,也默认作为连续变量使用,这就会产生一个问题,如果是无序分类变量,那么各类别间没有高低之分,每变化一个单位,对于因变量的影响是相同的,无法分析当中的趋势,虽然可以使用哑变量,但是当分类变量过多或每个变量的类别水平过多时,这种方法非常繁琐,此外,当类别较多时,可能会存在某几个类别对因变量的作用相似,这是可分析的点,但是传统线性模型却将此信息忽略,造成信息浪费。如果是有序分类变量,那么变量编码代表变量的高低顺序,这对于因变量的影响是不同的,而传统线性模型仍然忽略此信息,有可能会导致错误的分析结论。
基于以上问题,统计学家研究出了最优尺度变换这一方法,专门用于解决建模时如何对分类变量进行量化的问题。基本思想是基于希望拟合的模型框架,在保证各自变量间的联系为线性的前提下,通过一定的方法进行反复迭代,为原始分类变量找到一个最佳的量化评分,用这个评分代替原始变量进行后续的分析,这样一来,不仅仅是回归分析,任何包含分类自变量的分析方法都将适用于此,大大扩展了分析方法的适用范围。
最优尺度变换用于回归分析中,就是最优尺度回归,具体过程为
分析—回归—最佳尺度
本例中,我们想分析年龄、居住地、受教育程度对于子女数的影响,这里面年龄为连续变量,居住地为两分类变量、受教育程度为有序分类变量,从数据情况来看,自变量类型比较杂,年龄和居住地可以直接纳入模型分析,受教育程度可以设置哑变量形式引入模型,但是这样一来,相当于把该变量分散开,无法作为一个完整的变量进行分析了,在此,我们使用最优尺度回归。
以上结果都是将变量进行最优尺度变换之后的回归分析结果,那么如何查看变量的变换情况呢?该过程同时提供了转换图可供参考,点击绘制按钮设置即可
以上是关于SPSS数据分析—最优尺度回归的主要内容,如果未能解决你的问题,请参考以下文章