决策树状态栏&相关数值栏

Posted

技术标签:

【中文标题】决策树状态栏&相关数值栏【英文标题】:Decision Tree status column & related numerical value column 【发布时间】:2019-08-12 14:41:11 【问题描述】:

我的数据包括两列,其中一列明确显示功能的状态,另一列以数字形式显示相关值。如下所示:

我想通过 scikit learn 对这些数据运行决策树算法。我不确定如何处理这两列,因为从概念上讲,我无法弄清楚如何结合这些非常相关的特征。基本上,我们不应该留下空数据,但是,这个数据本质上应该在数值列中为空。如果我们将其设为“0”,则它具有另一种含义。

那么,我应该如何预处理这些数据以使决策树算法正常工作?

【问题讨论】:

请分享您迄今为止尝试过的内容,以及您面临的具体编程问题; SO 不是代码设计服务,建议您重新阅读How to Ask 和What topics can I ask about here?。 感谢您的洞察力。 【参考方案1】:

我的prefossor提供了一个合理的答案如下。

首先,用“0”填充空单元格。 如果将数据插入到具有这两个特征的决策树算法中,我们有两种情况:

如果首先出现“状态”: 树会将 0 和 1 分成两个分支。在 0 下,所有 Amount 值都已经为 0,因此不会选择此功能。 1以下,不会有任何0状态。

如果“金额”在前:所有状态 0 将只进入一个分支,它们将与金额非常小的那些合并。

因此,如果 Amount 数据有噪声,保留 Status 列可能会有所帮助。否则,我会删除状态列。

【讨论】:

以上是关于决策树状态栏&相关数值栏的主要内容,如果未能解决你的问题,请参考以下文章

Android系统定制-SystemUI-下拉状态栏快捷设置新增选项(自动亮度&静音)

Android TV 开发-->那些酷炫的状态栏 & 颜色选择器 & 布局相关 开源库整理

Android 透明状态栏&着色状态栏

iOS导航栏状态栏相关

维护基于树的导航栏的状态

IIViewDeck & 双高状态栏