如果我从 randomforest、gbm、svm、nnet 生成预测以获得更准确的预测,如何组合结果(预测)?

Posted

技术标签:

【中文标题】如果我从 randomforest、gbm、svm、nnet 生成预测以获得更准确的预测,如何组合结果(预测)?【英文标题】:How do I combine the results (predictions) if I have generated predictions from say, randomforest, gbm, svm, nnet to get more accurate predictions? 【发布时间】:2013-05-23 08:53:37 【问题描述】:

更具体地说,如何通过创建集成来改进我的预测?我的意思是我知道我们对从不同算法(随机森林、nnet、gbm、svm)获得的结果(预测)进行回归。但是我们该怎么做呢?

【问题讨论】:

【参考方案1】:

有很多不同的方法可以解决这个问题。一种方法是训练一个新的***模型,该模型的输入将是所有其他技术的输出向量。

解决这个问题的另一种方法是使用支持向量机经常使用的方法来解决多类问题。

这种方法类似于每个模型之间的锦标赛比赛,其中所有输出在它们之间进行比较以选择获胜者。通常这是使用“一对一”或“一对一”两种策略中的一种来完成的(这是一篇比较它们的论文http://www.researchgate.net/publication/228643199_One_Against_One_or_One_Against_All_Which_One_is_Better_for_Handwriting_Recognition_with_SVMs)

这些是我想到的方法,但我很确定您可以找到很多新颖的方法来解决这个问题。

【讨论】:

感谢您的回复。我会看一遍论文。

以上是关于如果我从 randomforest、gbm、svm、nnet 生成预测以获得更准确的预测,如何组合结果(预测)?的主要内容,如果未能解决你的问题,请参考以下文章

部分依赖图和梯度提升(GBM 包)

R语言使用caret包对GBM模型参数调优SVM模型自定义参数调优RDF模型自定义参数调优(例如,ROC)重采样对多个模型的性能差异进行统计描述可视化多模型在多指标下的性能对比分析

用于 R 中回归的 RandomForest

GBM 模型生成 NA 结果

如何对 RandomForest 进行二值化以在 python 中绘制 ROC?

随机森林分类 weka