scikit-learn中自带的均值方差归一化函数

Posted lyr999736

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scikit-learn中自带的均值方差归一化函数相关的知识,希望对你有一定的参考价值。

一:所在包

    from sklearn.preprocessing import StandardScaler。

二:步骤

  a.将训练集进行fit操作

  b.在将训练集进行transform操作,得到均值为0,方差为1的数据集。

  c.对测试集进行transform操作,但是不需要在进行fit,应使用训练集fit后得出的参数。

三:代码

 

import numpy as np
from sklearn import datasets
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

iris = datasets.load_iris()
x = iris.data
y = iris.target

x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=666)

standard = StandardScaler()
standard.fit(x_train)
x_train = standard.transform(x_train)

x_test_standard = standard.transform(x_test)

knn = KNeighborsClassifier(n_neighbors=3,n_jobs=-1)

knn.fit(x_train,y_train)


score = knn.score(x_test_standard,y_test)

print(score)

 

 

 

  

以上是关于scikit-learn中自带的均值方差归一化函数的主要内容,如果未能解决你的问题,请参考以下文章

如何计算/归一化零均值和单位方差

在消除低方差之前对数据进行归一化,会产生错误

归一化输入梯度消失/爆炸

[转载]中心化(又叫零均值化)和标准化(又叫归一化)

深度学习面试题22:批量归一化在实践中的应用

归一化输入梯度消失/爆炸小批量梯度下降