Python 数据归一化/标准化

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 数据归一化/标准化相关的知识,希望对你有一定的参考价值。

参考技术A 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。最典型的就是数据的归一化处理,即将数据统一映射到(0,1]区间上

(1)0-1标准化
将数据的最大最小值记录下来,并通过max-min作为基数(即min=0,max=1)进行数据的归一化处理

x=(x - min) / (max - min)

(2)Z-score标准化
Z分数(z-score),是一个分数与平均数的差再除以标准差的过程 → z=(x-μ)/σ,其中x为某一具体分数,μ为平均数,σ为标准差
Z值的量代表着原始分数和母体平均值之间的距离,是以标准差为单位计算。在原始分数低于平均值时Z则为负数,反之则为正数
数学意义:一个给定分数距离平均数多少个标准差?

python归一化处理

一、定义

  归一化方法有两种形式,一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。

  二、目的

  不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。其具体针对的是奇异样本数据,奇异样本数据指的是相对于其他输入样本特别大或特别小的样本矢量,如[0.34,0.51,0.44,222][0.34,0.51,0.44,128]中最后一列元素就是奇异样本数据。

  三、常见标准化方法

  1.最大-最小标准化映射到区间[0,1]

  

  2.Z-score标准化结果聚集在0附近方差为1

  

  四、矩阵的归一化

  矩阵的列归一化,就是将矩阵每一列的值,除以每一列所有元素平方和的绝对值,这样做的结果就是,矩阵每一列元素的平方和为1了。

  五、python归一化

  其中参数axis=0表示列也是跨行的意思axis=1表示行也是跨列的意思

  fromsklearn.preprocessingimportnormalize

  data=np.array([

  [1000,10,0.5],

  [765,5,0.35],

  [800,7,0.09],])

  data=normalize(data,axis=0,norm=\'max\')

  print(data)

  >>[[1.1.1.]

  [0.7650.50.7]

  [0.80.70.18]]

  参考:

  https://blog.csdn.net/acdreamers/article/details/44664205 归一化含义

  https://blog.csdn.net/lyhope9/article/details/82778459python 处理归一化

以上是关于Python 数据归一化/标准化的主要内容,如果未能解决你的问题,请参考以下文章

Python数据标准化归一化

数据变换-归一化与标准化

数据的归一化处理

归一化和标准化的一些理解

数据标准化和数据归一化有啥区别吗?

sklearn进行对数据标准化、归一化以及将数据还原的方法