特征顺序会影响 sklearn 中的决策树算法吗?

Posted

技术标签:

【中文标题】特征顺序会影响 sklearn 中的决策树算法吗?【英文标题】:Does feature order impact Decision tree algorithm in sklearn? 【发布时间】:2017-10-11 23:25:39 【问题描述】:

我读了一些资料:

decision tree document in sklearn

A Quora Answer

但是,如果我更改功能顺序,我可以找到(功能名称集: 数据中的 [a,b,c] 变为 [b,a,c])。这真的会影响决策树的结果吗?

【问题讨论】:

【参考方案1】:

不是真的。 Sklearn 通常使用购物车树,其中最佳分割是通过选择最小化成本函数的特征来决定的。所以列的顺序并不重要。

【讨论】:

谢谢,我有一个问题。如果数据太大(可能是 [10^6, 10^5])。第一次,我必须计算所有功能的最佳拆分器。那可能是O(n ^ 2)。这是非常缓慢的。这是正确的吗? 是的,单个 CART 决策树需要扫描所有数据和所有特征以找到最佳拆分。通常您不会自己编写树代码,因为有许多优化的库可以很快为您完成这项工作。

以上是关于特征顺序会影响 sklearn 中的决策树算法吗?的主要内容,如果未能解决你的问题,请参考以下文章

python中的sklearn中决策树使用的是哪一种算法

我们可以选择在 sklearn 中使用啥决策树算法吗?

sklearn实现决策树算法

如何返回在 sklearn 中由 DecisionTreeClassifier 创建的决策树中使用的特征

sklearn库学习----决策树(分类树DecisionTreeClassifier)

机器学习之手写决策树以及sklearn中的决策树及其可视化