scikit-learn 中 OneHotEncoder 解析

Posted AI算法攻城狮

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scikit-learn 中 OneHotEncoder 解析相关的知识,希望对你有一定的参考价值。

概要

在 sklearn 包中,OneHotEncoder 函数非常实用,它可以实现将分类特征的每个元素转化为一个可以用来计算的值。本篇详细讲解该函数的用法,也可以参考官网 sklearn.preprocessing.OneHotEncoder

解析

 
该函数在 sklearn.preprocessing 类中,格式为:

OneHotEncoder(
    n_values=’auto’, 
    categorical_features=’all’,  
    dtype=<class ‘numpy.float64’>,  
    sparse=True,  
    handle_unknown=’error’
)

为了方便理解,我们先看下面一个例子:

# -*- coding: utf-8 -*-

from sklearn.preprocessing import  OneHotEncoder

enc = OneHotEncoder()
enc.fit([[0, 0, 3],
         [1, 1, 0],
         [0, 2, 1],
         [1, 0, 2]])

ans = enc.transform([[0, 1, 3]]).toarray()  # 如果不加 toarray() 的话,输出的是稀疏的存储格式,即索引加值的形式,也可以通过参数指定 sparse = Fa

以上是关于scikit-learn 中 OneHotEncoder 解析的主要内容,如果未能解决你的问题,请参考以下文章

混淆矩阵中的 Scikit-learn 变化阈值

用scikit-learn进行LDA降维

是否可以在 scikit-learn 中打印决策树?

Python中计算TF-IDF(scikit-learn)

在 scikit-learn 中使用 nltk 搭配作为特征

用scikit-learn学习BIRCH聚类