Weka 决策树预测 NA 对缺失值的处理
Posted
技术标签:
【中文标题】Weka 决策树预测 NA 对缺失值的处理【英文标题】:Weka decision tree prediction NA treatment on missing values 【发布时间】:2015-07-03 00:49:42 【问题描述】:您好,目前我正在实施一个大型 Hellinger 距离决策树,但遇到了一个问题。我在树节点中有一个连续变量,我不知道树将如何预测我是否会有该变量的缺失值。 例如,该节点的拆分标准 =250。树在预测时会选择什么路径? 树训练数据在该变量中也有缺失值。
也许我应该用特定数字替换所有缺失值?
【问题讨论】:
【参考方案1】:您可以根据变量的行为采取行动。还要考虑分类器的值的影响。因此,如果可以概括,您可以使用最小值/最大值/平均值作为缺失值。
【讨论】:
【参考方案2】:通常坚持输入不包含 Null,然后用户可以在拟合之前找到一种对其进行编码的方法。如果您做出选择,那么您将迫使未来的用户使用您的选择。
【讨论】:
以上是关于Weka 决策树预测 NA 对缺失值的处理的主要内容,如果未能解决你的问题,请参考以下文章