逻辑模型的混淆矩阵
Posted
技术标签:
【中文标题】逻辑模型的混淆矩阵【英文标题】:confusion matrix for a logistic model 【发布时间】:2021-03-15 08:31:59 【问题描述】:我的数据包含使用分类和未分类观察结果区分两种田鼠的数据
我从 89 个样本中构建了一个逻辑模型,用于预测剩余 199 个样本的组成员身份
我的数据样本
Group M1 M2 Fora Phone len height Rost
1 multiplex 2078 1649 1708 3868 5463 2355 805
2 subterraneus 1749 1482 1462 3797 4855 2218 765
3 unknown 1841 1562 1585 3750 5024 2232 821
我将数据分成 89 个观测值来训练我的模型,并保留 199 个未知观测值进行预测
train.data = microtus[c(1:89),c(1:9)]
test.data = microtus[c(90:288),c(1:9)]
train.data$Group =ifelse(train.data$Group=="multiplex", 1, 0)
我的模特
model <- glm(Group ~ M1Left + M3Left + Foramen + Length + Height,
family = binomial(), data = train.data)
summary(model)
预测
pred <- predict(model, test.data, type = "response")
我建立了一个混淆矩阵
createConfusionMatrix=function(actual, preds)
predClass=ifelse(preds<0.5, 0, 1)
table(actual,predClass)
## Confusion matrix
createConfusionMatrix(test.data$Group,pred)
我的输出
predClass
actual 0 1
multiplex 0 0
subterraneus 0 0
unknown 70 129
我觉得这个输出不对?
我可以获得有关如何构建混淆矩阵的帮助吗?
【问题讨论】:
也许这有帮助:***.com/questions/25497398/… @jottbe 我试过这个方法。它对我不起作用。 【参考方案1】:您的代码正在运行(使用您共享的数据):
#Code
i <- sample(1:3,288,replace = T)
#Data
microtus <- df[i,]
#Split
train.data = microtus[c(1:89),]
test.data = microtus[c(90:288),]
train.data$Group =ifelse(train.data$Group=="multiplex", 1, 0)
#Model
model <- glm(Group ~ M1 + M2 + Fora + len + height,
family = binomial(), data = train.data)
#Predict
test.data$pred <- predict(model, test.data, type = "response")
#Check
createConfusionMatrix=function(actual, preds)
predClass=ifelse(preds<0.5, 0, 1)
table(actual,predClass)
## Confusion matrix
createConfusionMatrix(test.data$Group,test.data$pred)
输出:
predClass
actual 0 1
multiplex 0 75
subterraneus 57 0
unknown 67 0
使用的一些数据:
#Data
df <- structure(list(Group = c("multiplex", "subterraneus", "unknown"
), M1 = c(2078L, 1749L, 1841L), M2 = c(1649L, 1482L, 1562L),
Fora = c(1708L, 1462L, 1585L), Phone = c(3868L, 3797L, 3750L
), len = c(5463L, 4855L, 5024L), height = c(2355L, 2218L,
2232L), Rost = c(805L, 765L, 821L)), class = "data.frame", row.names = c("1",
"2", "3"))
也许开始一个新的会话,然后再试一次。
【讨论】:
以上是关于逻辑模型的混淆矩阵的主要内容,如果未能解决你的问题,请参考以下文章
机器学习100天(十九):019 分类模型评价指标-混淆矩阵
R语言编写自定义函数计算分类模型评估指标:准确度特异度敏感度PPVNPV数据数据为模型预测后的混淆矩阵比较多个分类模型分类性能(逻辑回归决策树随机森林支持向量机)