机器学习编码分类特征编码LabelEncoder与OneHotEncoder

Posted AI算法攻城狮

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习编码分类特征编码LabelEncoder与OneHotEncoder相关的知识,希望对你有一定的参考价值。

LabelEncoder

LabelEncoder是用来对分类型特征值进行编码,即对不连续的数值或文本进行编码。其中包含以下常用方法:

fit(y) :fit可看做一本空字典,y可看作要塞到字典中的词。
fit_transform(y):相当于先进行fit再进行transform,即把y塞到字典中去以后再进行transform得到索引值。
inverse_transform(y):根据索引值y获得原始数据。
transform(y) :将y转变成索引值。

from sklearn import preprocessing
le = preprocessing.LabelEncoder()
le.fit([1, 2, 2, 6])
print(le.classes_

以上是关于机器学习编码分类特征编码LabelEncoder与OneHotEncoder的主要内容,如果未能解决你的问题,请参考以下文章

机器学习编码分类特征编码LabelEncoder与OneHotEncoder

机器学习编码分类特征编码LabelEncoder与OneHotEncoder

OneHotEncoder独热编码和 LabelEncoder标签编码

独热编码(One-Hot Encoding)和 LabelEncoder标签编码 区别 数据预处理:(机器学习) sklearn

机器学习:如何在具有分类和数字特征的 pandas 数据帧上应用一种热编码?

机器学习入门-数据预处理-数字映射和one-hot编码 1.LabelEncoder(进行数据自编码) 2.map(进行字典的数字编码映射) 3.OnehotEncoder(进行one-hot编码)