来自 rpart 的混淆矩阵

Posted

技术标签:

【中文标题】来自 rpart 的混淆矩阵【英文标题】:confusion matrix from rpart 【发布时间】:2014-02-11 23:31:11 【问题描述】:

我终其一生都无法弄清楚如何在 rpart 上计算混淆矩阵。

这是我所做的:

set.seed(12345)
UBANK_rand <- UBank[order(runif(1000)), ]
UBank_train <- UBank_rand[1:900, ]
UBank_test  <- UBank_rand[901:1000, ]


dim(UBank_train)
dim(UBank_test)

#Build the formula for the Decision Tree
UB_tree <- Personal.Loan ~ Experience + Age+ Income +ZIP.Code + Family + CCAvg + Education

#Building the Decision Tree from Test Data
UB_rpart <- rpart(UB_tree, data=UBank_train)

现在,我想我会做类似的事情

table(predict(UB_rpart, UBank_test, UBank_Test$Default))

但这并没有给我一个混淆矩阵。

【问题讨论】:

【参考方案1】:

你可以试试

pred <- predict(UB_rpart, UB_test) confusionMatrix(pred, UB_test$Personal.Loan)

【讨论】:

【参考方案2】:

您没有提供可重现的示例,所以我将创建一个合成数据集:

set.seed(144)
df = data.frame(outcome = as.factor(sample(c(0, 1), 100, replace=T)),
                x = rnorm(100))

带有type="class"rpart 模型的predict 函数将返回每个观察的预测类。

library(rpart)
mod = rpart(outcome ~ x, data=df)
pred = predict(mod, type="class")
table(pred)
# pred
#  0  1 
# 51 49 

最后,您可以通过在预测和真实结果之间运行table 来构建混淆矩阵:

table(pred, df$outcome)
# pred  0  1
#    0 36 15
#    1 14 35

【讨论】:

以上是关于来自 rpart 的混淆矩阵的主要内容,如果未能解决你的问题,请参考以下文章

如何标准化混淆矩阵?

不正确的混淆矩阵图

混淆矩阵和列联表有啥区别?

编写一个函数,使用 svm 找到混淆矩阵进行分类

使用 plot_confusion_matrix 绘制多个混淆矩阵

卡尔曼滤波器中预测矩阵和测量协方差矩阵之间的混淆