特征顺序会影响 sklearn 中的决策树算法吗?
Posted
技术标签:
【中文标题】特征顺序会影响 sklearn 中的决策树算法吗?【英文标题】:Does feature order impact Decision tree algorithm in sklearn? 【发布时间】:2017-10-11 23:25:39 【问题描述】:我读了一些资料:
decision tree document in sklearn
A Quora Answer
但是,如果我更改功能顺序,我可以找到(功能名称集: 数据中的 [a,b,c] 变为 [b,a,c])。这真的会影响决策树的结果吗?
【问题讨论】:
【参考方案1】:不是真的。 Sklearn 通常使用购物车树,其中最佳分割是通过选择最小化成本函数的特征来决定的。所以列的顺序并不重要。
【讨论】:
谢谢,我有一个问题。如果数据太大(可能是 [10^6, 10^5])。第一次,我必须计算所有功能的最佳拆分器。那可能是O(n ^ 2)。这是非常缓慢的。这是正确的吗? 是的,单个 CART 决策树需要扫描所有数据和所有特征以找到最佳拆分。通常您不会自己编写树代码,因为有许多优化的库可以很快为您完成这项工作。以上是关于特征顺序会影响 sklearn 中的决策树算法吗?的主要内容,如果未能解决你的问题,请参考以下文章
如何返回在 sklearn 中由 DecisionTreeClassifier 创建的决策树中使用的特征