sklearn 数据预处理

Posted eclipSycn

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sklearn 数据预处理相关的知识,希望对你有一定的参考价值。

http://www.cnblogs.com/chaosimple/p/4153167.html

其中介绍了sklearn.preprocessing.StandardScaler类,使用该类的好处在于可以保存训练集中的参数(均值、方差)直接使用其对象转换测试集数据。

>>> scaler = preprocessing.StandardScaler().fit(X)
>>> scaler
StandardScaler(copy=True, with_mean=True, with_std=True)
 
>>> scaler.mean_                                      
array([ 1. ...,  0. ...,  0.33...])
 
>>> scaler.std_                                       
array([ 0.81...,  0.81...,  1.24...])
 
>>> scaler.transform(X)                               
array([[ 0.  ..., -1.22...,  1.33...],
       [ 1.22...,  0.  ..., -0.26...],
       [-1.22...,  1.22..., -1.06...]])
 
 
>>>#可以直接使用训练集对测试集数据进行转换
>>> scaler.transform([[-1.,  1., 0.]])                
array([[-2.44...,  1.22..., -0.26...]])

 

以上是关于sklearn 数据预处理的主要内容,如果未能解决你的问题,请参考以下文章

Python-sklearn数据预处理(单/多个数据集数据标准化稳健标准化缺失值填补)

sklearn当中怎样去除数据与结果无关的属性

sklearn当中怎样去除数据与结果无关的属性

sklearn cookbook 总结

sklearn cookbook 总结

Sklearn机器学习基础(day01基本数据处理)