特征工程之归一化及标准化

Posted shixinzei

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了特征工程之归一化及标准化相关的知识,希望对你有一定的参考价值。

特征的预处理:对数据进行处理

特征处理:通过特定的统计方法(数学方法)将数据转换成算法要求的数据

技术分享图片

 

归一化:

多个特征同等重要的时候需要进行归一化处理
目的:使得某一个特征对最终结果不会造成更大影响

技术分享图片

技术分享图片

技术分享图片

归一化API:

技术分享图片

技术分享图片

技术分享图片

技术分享图片

 

标准化:

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

归一化及标准化实例代码:

# 数据预处理
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardScaler


def mm():
    ‘‘‘
    归一化处理
    :return:None
    ‘‘‘
    # mm = MinMaxScaler()
    mm = MinMaxScaler(feature_range=(2, 3))
    data = mm.fit_transform([[90, 2, 10, 40], [60, 4, 15, 45], [75, 3, 13, 46]])
    print(data)
    return None


def stand():
    ‘‘‘
    标准化缩放
    :return:None
    ‘‘‘
    std = StandardScaler()
    data = std.fit_transform([[1, -1, 3], [2, 4, 2], [4, 6, -1]])
    print(data)
    return None


if __name__ == "__main__":
    mm()
    stand()

运行结果:

技术分享图片

 

以上是关于特征工程之归一化及标准化的主要内容,如果未能解决你的问题,请参考以下文章

模式识别 - 特征归一化 及 測试 代码(Matlab)

特征工程2:归一化与标准化

特征工程:归一化和标准化的原理以及区别

特征工程之特征预处理

特征工程——特征预处理

特征工程