scikit-learn 中 OneHotEncoder 解析
Posted AI算法攻城狮
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scikit-learn 中 OneHotEncoder 解析相关的知识,希望对你有一定的参考价值。
概要
在 sklearn 包中,OneHotEncoder 函数非常实用,它可以实现将分类特征的每个元素转化为一个可以用来计算的值。本篇详细讲解该函数的用法,也可以参考官网 sklearn.preprocessing.OneHotEncoder。
解析
该函数在 sklearn.preprocessing
类中,格式为:
OneHotEncoder(
n_values=’auto’,
categorical_features=’all’,
dtype=<class ‘numpy.float64’>,
sparse=True,
handle_unknown=’error’
)
为了方便理解,我们先看下面一个例子:
# -*- coding: utf-8 -*-
from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder()
enc.fit([[0, 0, 3],
[1, 1, 0],
[0, 2, 1],
[1, 0, 2]])
ans = enc.transform([[0, 1, 3]]).toarray() # 如果不加 toarray() 的话,输出的是稀疏的存储格式,即索引加值的形式,也可以通过参数指定 sparse = Fa
以上是关于scikit-learn 中 OneHotEncoder 解析的主要内容,如果未能解决你的问题,请参考以下文章