spss实现中心化处理、标准化处理和归一化处理

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spss实现中心化处理、标准化处理和归一化处理相关的知识,希望对你有一定的参考价值。

参考技术A 转自https://blog.csdn.net/shouji111111/article/details/88675289

一、中心化、标准化、归一化简单描述

意义:数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。

原理:

数据标准化:是指数值减去均值,再除以标准差;

数据中心化:是指变量减去它的均值;

归一化:把数变为(0,1)之间的小数。

二、中心化处理

        数据的中心化是指原数据减去该组数据的平均值,经过中心化处理后,原数据的坐标平移至中心点(0,0),该组数据的均值变为0,以此也被称为零均值化。

三、标准化处理

        大型数据分析项目中,数据来源不同,量纲及量纲单位不同,为了让它们具备可比性,需要采用标准化方法消除由此带来的偏差。 原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。这就是数据标准化。

        基本原理:数值减去平均值,再除以其标准差,得到均值为0,标准差为1的服从标准正态分布的数据。

        在SPSS中,使用最多的就是Z-score标准化(0-1标准化)方法,这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。

四、归一化处理

归一化方法:

把数变为(0,1)之间的小数

主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速

把有量纲表达式变为无量纲表达式,成为纯量。归一化,也算是数据标准化方法之一。常见的计算公式如下,得到新数据范围在[0,1]之间,归一化由此得名。

以上是关于spss实现中心化处理、标准化处理和归一化处理的主要内容,如果未能解决你的问题,请参考以下文章

特征预处理

中心化、标准化、归一化?

特征工程——特征预处理

特征工程之特征预处理

Python 数据归一化/标准化

归一化和标准化的一些理解