Weka:如何在 J48 决策树中实现代理拆分?

Posted

技术标签:

【中文标题】Weka:如何在 J48 决策树中实现代理拆分?【英文标题】:Weka: How can I implement a Surrogate Split in J48 Decision Tree? 【发布时间】:2014-08-29 01:56:43 【问题描述】:

任何人都可以帮助我使用 Java 中的 Weka API 在 J48 算法中实现替代的缺失值处理。

我确信在训练 J48 之前使用预插补方法很容易。

但是在划分训练日期的情况下使用代理拆分属性(就像 Breiman 在 CART 中所做的那样)而不是 J48 标准方法(C4.5 中的 Quinlan)将案例从观察到的案例中拆分为概率分布已知值。

谁能给我一些信息、提示、帮助,在 Weka API 和源代码中必须修改哪些地方才能用代理拆分替换标准?

【问题讨论】:

【参考方案1】:

查看第 152 行的 weka 源代码 weka.classifiers.trees.j48.C45ModelSelection(查找“最佳”属性以进行拆分)。它以信息增益比作为分割标准。

【讨论】:

以上是关于Weka:如何在 J48 决策树中实现代理拆分?的主要内容,如果未能解决你的问题,请参考以下文章

weka 代码 算法 j48 决策树 c4.5

R Weka J48决策树无法处理数字类

尝试将 AdaBostM1 weka 分类器与配置用于修剪的 J48 决策树分类器一起使用时,Weka 引发命令行错误

如何在 Weka 构建的决策树中找到特征重要性

如何使用 Weka API 请求单个属性的输入以遍历决策树?

weka J48 功能选择