是一个热门编码是免费的虚拟陷阱[关闭]
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了是一个热门编码是免费的虚拟陷阱[关闭]相关的知识,希望对你有一定的参考价值。
在一个热编码器中有一个叫做虚拟陷阱的东西,当我们用3个类别对分类列进行编码,以免说a,b和c然后用一个热编码器我们得到3个类别或者列a,b和c但是当我们使用get_dummies我们得到2列而不是a,然后b从虚拟陷阱中保存。是一个暴露于虚拟陷阱的热门编码或它负责它。我对吗?哪一个是假陷阱?或者可以同时使用我们的删除列,我使用数据集进行许多算法。
寻求帮助。提前致谢。
答案
OneHotEncoder
无法直接处理字符串值。如果您的名义特征是字符串,那么您需要首先将它们映射为整数。
pandas.get_dummies
恰恰相反。默认情况下,除非指定了列,否则它仅将字符串列转换为单热表示。
以上是关于是一个热门编码是免费的虚拟陷阱[关闭]的主要内容,如果未能解决你的问题,请参考以下文章