是一个热门编码是免费的虚拟陷阱[关闭]

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了是一个热门编码是免费的虚拟陷阱[关闭]相关的知识,希望对你有一定的参考价值。

在一个热编码器中有一个叫做虚拟陷阱的东西,当我们用3个类别对分类列进行编码,以免说a,b和c然后用一个热编码器我们得到3个类别或者列a,b和c但是当我们使用get_dummies我们得到2列而不是a,然后b从虚拟陷阱中保存。是一个暴露于虚拟陷阱的热门编码或它负责它。我对吗?哪一个是假陷阱?或者可以同时使用我们的删除列,我使用数据集进行许多算法。

寻求帮助。提前致谢。

答案

OneHotEncoder无法直接处理字符串值。如果您的名义特征是字符串,那么您需要首先将它们映射为整数。

pandas.get_dummies恰恰相反。默认情况下,除非指定了列,否则它仅将字符串列转换为单热表示。

以上是关于是一个热门编码是免费的虚拟陷阱[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

热门从另一个片段导航到主页片段

Scala资料免费送Scala代码编写中常见的十大陷阱

免费人事管理系统暗藏陷阱

编码SLL时获取中止陷阱6

带有红宝石集合/可枚举的酷技巧和富有表现力的片段[关闭]

C# 最有用的(自定义)代码片段是啥? [关闭]