决策树状态栏&相关数值栏
Posted
技术标签:
【中文标题】决策树状态栏&相关数值栏【英文标题】:Decision Tree status column & related numerical value column 【发布时间】:2019-08-12 14:41:11 【问题描述】:我的数据包括两列,其中一列明确显示功能的状态,另一列以数字形式显示相关值。如下所示:
我想通过 scikit learn 对这些数据运行决策树算法。我不确定如何处理这两列,因为从概念上讲,我无法弄清楚如何结合这些非常相关的特征。基本上,我们不应该留下空数据,但是,这个数据本质上应该在数值列中为空。如果我们将其设为“0”,则它具有另一种含义。
那么,我应该如何预处理这些数据以使决策树算法正常工作?
【问题讨论】:
请分享您迄今为止尝试过的内容,以及您面临的具体编程问题; SO 不是代码设计服务,建议您重新阅读How to Ask 和What topics can I ask about here?。 感谢您的洞察力。 【参考方案1】:我的prefossor提供了一个合理的答案如下。
首先,用“0”填充空单元格。 如果将数据插入到具有这两个特征的决策树算法中,我们有两种情况:
如果首先出现“状态”: 树会将 0 和 1 分成两个分支。在 0 下,所有 Amount 值都已经为 0,因此不会选择此功能。 1以下,不会有任何0状态。
如果“金额”在前:所有状态 0 将只进入一个分支,它们将与金额非常小的那些合并。
因此,如果 Amount 数据有噪声,保留 Status 列可能会有所帮助。否则,我会删除状态列。
【讨论】:
以上是关于决策树状态栏&相关数值栏的主要内容,如果未能解决你的问题,请参考以下文章
Android系统定制-SystemUI-下拉状态栏快捷设置新增选项(自动亮度&静音)