0/1 python的分类数据是/否-这是正确的方法吗?

Posted

技术标签:

【中文标题】0/1 python的分类数据是/否-这是正确的方法吗?【英文标题】:Categorical Data yes/no to 0/1 python - is it a right approach? 【发布时间】:2018-08-20 00:23:27 【问题描述】:

我的数据集几乎没有是/否的特征(分类数据)。我在 python 中使用的一些机器学习算法不直接处理分类数据。我知道如何将是/否转换为 0/1,但我的问题是 - 这是一个正确的方法吗? 这些从否/是到 0/1 的值会被算法误解吗?

我计划用于我的数据集的算法是 - 决策树 (DT)、随机森林 (RF) 和神经网络 (NN)。

【问题讨论】:

【参考方案1】:

是的,在我看来,将 yes/no 编码为 1/0 对您来说是正确的方法。 Python 的 sklearn 需要数值数组中的特征。 有多种编码方式:标签编码器;一个热编码器。等等 但是,由于您的变量只有 2 级类别,因此选择 LabelEncoder 或 OneHotEncoder 不会有太大区别。

【讨论】:

以上是关于0/1 python的分类数据是/否-这是正确的方法吗?的主要内容,如果未能解决你的问题,请参考以下文章

这是正确使用sklearn分类报告进行多标签分类报告吗?

将随机森林分类分解成python中的碎片?

尝试/除了使用 Python requests 模块的正确方法?

scikit-learn 决策树 分类问题

在 Drupal 中,我如何链接两个分类法?

垃圾邮件分类 - 机器学习