何时使用随机森林
Posted
技术标签:
【中文标题】何时使用随机森林【英文标题】:When to use random forest 【发布时间】:2019-11-13 15:39:07 【问题描述】:我了解随机森林模型可用于分类和回归情况。是否有更具体的标准来确定随机森林模型在哪些方面的表现优于普通回归(线性、套索等)来估计值或分类的逻辑回归?
【问题讨论】:
“数据科学”可以进一步帮助解决这个问题。 所有模型都是错误的,但有些是有用的。 【参考方案1】:随机森林模型的思想是由一堆决策树构建而成的,它是一种有监督的集成学习算法,用于减少单个决策树中的过拟合问题。
机器学习的理论是,没有一个模型可以胜过所有其他模型,因此,始终建议在获得最佳模型之前尝试不同的模型。
话虽如此,当处理不同性质的数据时,模型选择存在偏好。每个模型都对数据做出内在假设,并且假设与数据最一致的模型通常更适合数据。例如,逻辑模型适用于具有平滑线性决策边界的分类数据,并且如果数据具有此特征,而随机森林不假设平滑线性决策边界。因此,数据的性质会影响您对模型的选择,最好在得出结论之前全部尝试一下。
【讨论】:
以上是关于何时使用随机森林的主要内容,如果未能解决你的问题,请参考以下文章