为啥基尼指数考虑决策树中的二分法?

Posted

技术标签:

【中文标题】为啥基尼指数考虑决策树中的二分法?【英文标题】:Why Gini index considers a binary split in decision trees?为什么基尼指数考虑决策树中的二分法? 【发布时间】:2017-05-13 13:05:18 【问题描述】:

根据我的参考资料(见下面的链接),似乎基尼指数考虑了决策树中的二分法。为什么不能考虑多路拆分?

http://webserver.inf.unibz.it/dis/teaching/DWDM/slides2011/lesson5-Classification-2.pdf

Example from Google Book Search

【问题讨论】:

【参考方案1】:

原则上,树不仅限于二叉分裂,还可以根据基尼指数或其他选择标准通过多路分裂生长。然而,在数值变量中寻找多路分割的(局部最优)将变得更加繁重。因此,树算法通常依赖于二元分裂的贪婪前向选择,其中同一变量中的后续二元分裂也可以表示多路分裂。更多讨论见:https://stats.stackexchange.com/questions/12187/are-decision-trees-almost-always-binary-trees

【讨论】:

以上是关于为啥基尼指数考虑决策树中的二分法?的主要内容,如果未能解决你的问题,请参考以下文章

决策树中的熵和基尼指数

CART决策树----基尼指数划分

使用基尼指数的决策树

决策树系列三——基尼指数,减枝和

西瓜书决策树笔记

机器学习之手写决策树以及sklearn中的决策树及其可视化