如何找到决策树中每个叶子或节点的索引?

Posted

技术标签:

【中文标题】如何找到决策树中每个叶子或节点的索引?【英文标题】:How to find the index of each leaf or node in a Decision Tree? 【发布时间】:2020-07-25 06:47:06 【问题描述】:

主要问题是找到每个样本被分类到哪个叶子节点。使用tree.apply 的帖子数以千计。这个函数我很清楚,它返回叶子节点的索引。

现在,我想在图的节点中添加叶子索引(我使用 Graphviz 生成)。

绘制用于索引的枚举技术是行不通的。我正在开发的决策树很大。因此,我需要能够在图中打印叶子索引。

我愿意接受的另一个选择是生成一个包含决策树叶节点的所有叶索引(以相同顺序)的数组。有关如何执行此操作的任何提示?

【问题讨论】:

【参考方案1】:

命令export_graphviz有一个参数node_ids。当此参数设置为True时,则在决策树的标签上添加索引。

【讨论】:

以上是关于如何找到决策树中每个叶子或节点的索引?的主要内容,如果未能解决你的问题,请参考以下文章

机器学习系列-决策树

为决策树中的每个数据点找到对应的叶节点(scikit-learn)

sklearn 决策树:获取每个节点和叶子的记录(**有效**)

在决策树中权衡样本

《统计学习方法》读书笔记之决策树

ID3决策树