输出选定的决策树叶

Posted

技术标签:

【中文标题】输出选定的决策树叶【英文标题】:Output Selected Decision Tree Leaf 【发布时间】:2012-12-02 01:54:20 【问题描述】:

我正在尝试可视化决策树如何应用于测试集,并且我正在使用 Weka 的 J48 决策树。 Weka 通过评估决策树并到达叶子来将每个样本识别为一个类别。当然,多个叶子被标记为同一个类。有谁知道如何让 Weka 为每个样本说出它用来标记该样本的叶子?

X < 47
|  Y > 10  : Class1 (...)
|  Y <= 10 : Class2 (...)
X >= 47
|  Y > 15  : Class1 (...)
|  Y <= 15
|  |  Z > 10  : Class2 (...)
|  |  Z <= 10 : Class1 (...)

我想要“样本 15 被归类为 Class1,因为 (X>=47, Y

或者,我想要“27 个样本被归类为 Class1,因为 (X>=47, Y

另外,是否有人知道有人可视化此信息的实例,或其他软件会吐出此信息?谢谢。

【问题讨论】:

【参考方案1】:

如果有人知道,我仍然想要一个真正的答案,但我的答案是 Weka 不包含此能力。我的解决方案是做一个我需要的东西。可以在这里找到:

GitHub:DecisionTreeDNA

我还没有完成。它将用数字构建一个很酷的图表,但它已经吐出了我想要的那些数字。哦 - 它吐出的数字是“27 个样本被归类为 Class1 因为 (X>=47, Y=47, Y

【讨论】:

以上是关于输出选定的决策树叶的主要内容,如果未能解决你的问题,请参考以下文章

决策树之ID3C4.5C5.0 CART

决策树算法

决策树

决策树算法

决策树算法

大数据-决策树