python 机器学习之数据预处理
Posted The_Chain
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 机器学习之数据预处理相关的知识,希望对你有一定的参考价值。
#数据预处理方法,主要是处理数据的量纲和同趋势化问题。
import numpy as np
from sklearn import preprocessing
#零均值规范
data=np.random.rand(3,4)#随机生成3行4列的数据
data_standardized=preprocessing.scale(data)#对数据进行归一化处理,即每个数值减去均值除以方差 主要用于svm
#线性数据变换最大最小化处理
data_scaler=preprocessing.MinMaxScaler(feature_range=(0,1))#选定区间(0,1),原始数据-最小值/(最大值-最小值)
data_scaled=data_scaler.fit(data)
#数据标准化处理normalized
data_normalized=preprocessing.normalize(data,norm=‘l1‘)#减少人为增加特征,经过处理后数据贾总等于1
#特征二值化,
data_binarized=prepressing.Binarizer(threshold=0.5).transform(data)#以0.5为阈值,大于0.5为1,小于0.5为0
#label_encode对标签进行数值化
label_encode=preprocessing.LabelEncoder()
input_class=[‘audi‘,‘ford‘,‘audi‘,‘bmw‘,‘toyota‘,‘benz‘]
label_encode.fit(input_class)
for i ,item in enmerate(label_encode.class_):
print(item,‘-->‘,i)
#onehotencode
以上是关于python 机器学习之数据预处理的主要内容,如果未能解决你的问题,请参考以下文章