如何绘制随机森林模型的决策边界

Posted 2023-03-12

技术标签:

【中文标题】如何绘制随机森林模型的决策边界【英文标题】：How to plot a decision boundary of random forest model 【发布时间】：2015-09-23 10:18:49 【问题描述】：

我有

## Classification:
library("randomForest")
data=iris
data<-data[data$Species!="setosa",]
data$Species<-factor(as.character(data$Species))
iris.rf <- randomForest(Species ~ Sepal.Length+Petal.Length, data=data, importance=TRUE,            proximity=TRUE)

我想构造一个带有决策边界的Sepal.Length~Petal.Length。这将是一个什么样的边界？ 2 个类别中的每一个的概率为 0.5？

【问题讨论】：

【参考方案1】：

您有一个随机森林，因此不一定有一个明确的决策边界，就像您从 SVM 等非概率线性分类器中获得的那样。但是你可以用类似的东西来绘制它......

library(ggplot2)
ggplot(data=data,aes(x=Petal.Length, y=Sepal.Length, color= iris.rf$predicted) ) + 
       geom_point()

在这种情况下是的，因为你只在两个类上训练它，颜色变化表示的边界发生在 0.5。

【讨论】：

如果您输入 RF 模型 newdata=data.frame(expand.grid(Sepal.Length=seq(5,8,0.1), Petal.Length=seq(3,7,0.1)) ) 你不应该能够在 Sepal.Length ~ Petal.Length 平面上获得决策边界吗？你想得到看起来像第三个数字here的东西吗？如果x轴和y轴是RF模型的2个自变量，是的。

以上是关于如何绘制随机森林模型的决策边界的主要内容，如果未能解决你的问题，请参考以下文章