Weka:如何在 J48 决策树中实现代理拆分?
Posted
技术标签:
【中文标题】Weka:如何在 J48 决策树中实现代理拆分?【英文标题】:Weka: How can I implement a Surrogate Split in J48 Decision Tree? 【发布时间】:2014-08-29 01:56:43 【问题描述】:任何人都可以帮助我使用 Java 中的 Weka API 在 J48 算法中实现替代的缺失值处理。
我确信在训练 J48 之前使用预插补方法很容易。
但是在划分训练日期的情况下使用代理拆分属性(就像 Breiman 在 CART 中所做的那样)而不是 J48 标准方法(C4.5 中的 Quinlan)将案例从观察到的案例中拆分为概率分布已知值。
谁能给我一些信息、提示、帮助,在 Weka API 和源代码中必须修改哪些地方才能用代理拆分替换标准?
【问题讨论】:
【参考方案1】:查看第 152 行的 weka 源代码 weka.classifiers.trees.j48.C45ModelSelection(查找“最佳”属性以进行拆分)。它以信息增益比作为分割标准。
【讨论】:
以上是关于Weka:如何在 J48 决策树中实现代理拆分?的主要内容,如果未能解决你的问题,请参考以下文章
尝试将 AdaBostM1 weka 分类器与配置用于修剪的 J48 决策树分类器一起使用时,Weka 引发命令行错误