0/1 python的分类数据是/否-这是正确的方法吗?
Posted
技术标签:
【中文标题】0/1 python的分类数据是/否-这是正确的方法吗?【英文标题】:Categorical Data yes/no to 0/1 python - is it a right approach? 【发布时间】:2018-08-20 00:23:27 【问题描述】:我的数据集几乎没有是/否的特征(分类数据)。我在 python 中使用的一些机器学习算法不直接处理分类数据。我知道如何将是/否转换为 0/1,但我的问题是 - 这是一个正确的方法吗? 这些从否/是到 0/1 的值会被算法误解吗?
我计划用于我的数据集的算法是 - 决策树 (DT)、随机森林 (RF) 和神经网络 (NN)。
【问题讨论】:
【参考方案1】:是的,在我看来,将 yes/no 编码为 1/0 对您来说是正确的方法。 Python 的 sklearn 需要数值数组中的特征。 有多种编码方式:标签编码器;一个热编码器。等等 但是,由于您的变量只有 2 级类别,因此选择 LabelEncoder 或 OneHotEncoder 不会有太大区别。
【讨论】:
以上是关于0/1 python的分类数据是/否-这是正确的方法吗?的主要内容,如果未能解决你的问题,请参考以下文章