最优尺度分析
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了最优尺度分析相关的知识,希望对你有一定的参考价值。
参考技术A 分析不同地区个体月收入的影响因子由图可知:本次的数据呈现的结果是共计1072份,其中缺失为146份,实际有效为926份。
执行analyze/regression/optimal scaling(CATREG),并在数据置入dependent variable的时候将收入置为“numeric”;将城市置为“nominal”;将性别置为“nominal”;将“学历”置为“ordinal”;将职业置为“nominal”;将婚姻状况置为“nominal”即可。
得到如下几图:
由上图可知,调整后的R方值为0.30,还是比较小,一般情况下,越靠近1,结果越好。
这里我们主要看显著性:
家庭月收入和城市所在地显著相关( F =7.126, P =0.001);
家庭月收入和学历显著相关( F =200.961, P =0.000);
家庭月收入和职业显著相关( F =79.718, P =0.000);
家庭月收入和婚姻状况显著相关( F =18.632, P =0.000);
家庭月收入和性别无显著相关性,其中P>0.05;
从图中的重要性一栏中,可以看到,在月收入的影响中,学历是最重要的,职业次之,剩下依次为婚姻状况,城市和性别。
以上数据结果仅属于部分判断,仅为学习之用,若有不合适之处,望请海涵。O(∩_∩)O哈哈~
SPSS数据分析—最优尺度回归
在之前介绍的线性回归模型中,有一个隐含的假设是自变量均为连续变量,但实际上自变量有时候是分类变量,类似于方差分析中的因素,这种分类自变量在回归分析中,也默认作为连续变量使用,这就会产生一个问题,如果是无序分类变量,那么各类别间没有高低之分,每变化一个单位,对于因变量的影响是相同的,无法分析当中的趋势,虽然可以使用哑变量,但是当分类变量过多或每个变量的类别水平过多时,这种方法非常繁琐,此外,当类别较多时,可能会存在某几个类别对因变量的作用相似,这是可分析的点,但是传统线性模型却将此信息忽略,造成信息浪费。如果是有序分类变量,那么变量编码代表变量的高低顺序,这对于因变量的影响是不同的,而传统线性模型仍然忽略此信息,有可能会导致错误的分析结论。
基于以上问题,统计学家研究出了最优尺度变换这一方法,专门用于解决建模时如何对分类变量进行量化的问题。基本思想是基于希望拟合的模型框架,在保证各自变量间的联系为线性的前提下,通过一定的方法进行反复迭代,为原始分类变量找到一个最佳的量化评分,用这个评分代替原始变量进行后续的分析,这样一来,不仅仅是回归分析,任何包含分类自变量的分析方法都将适用于此,大大扩展了分析方法的适用范围。
最优尺度变换用于回归分析中,就是最优尺度回归,具体过程为
分析—回归—最佳尺度
本例中,我们想分析年龄、居住地、受教育程度对于子女数的影响,这里面年龄为连续变量,居住地为两分类变量、受教育程度为有序分类变量,从数据情况来看,自变量类型比较杂,年龄和居住地可以直接纳入模型分析,受教育程度可以设置哑变量形式引入模型,但是这样一来,相当于把该变量分散开,无法作为一个完整的变量进行分析了,在此,我们使用最优尺度回归。
以上结果都是将变量进行最优尺度变换之后的回归分析结果,那么如何查看变量的变换情况呢?该过程同时提供了转换图可供参考,点击绘制按钮设置即可
以上是关于最优尺度分析的主要内容,如果未能解决你的问题,请参考以下文章