逻辑模型的混淆矩阵

Posted

技术标签:

【中文标题】逻辑模型的混淆矩阵【英文标题】:confusion matrix for a logistic model 【发布时间】:2021-03-15 08:31:59 【问题描述】:

我的数据包含使用分类和未分类观察结果区分两种田鼠的数据

我从 89 个样本中构建了一个逻辑模型,用于预测剩余 199 个样本的组成员身份

我的数据样本

Group           M1      M2      Fora    Phone   len     height  Rost
1   multiplex       2078    1649    1708    3868    5463    2355    805
2   subterraneus    1749    1482    1462    3797    4855    2218    765 
3   unknown         1841    1562    1585    3750    5024    2232    821

我将数据分成 89 个观测值来训练我的模型,并保留 199 个未知观测值进行预测

train.data = microtus[c(1:89),c(1:9)]
test.data = microtus[c(90:288),c(1:9)]
train.data$Group =ifelse(train.data$Group=="multiplex", 1, 0)

我的模特

model <- glm(Group ~ M1Left + M3Left + Foramen + Length + Height, 
    family = binomial(), data = train.data)
summary(model)

预测

pred <- predict(model, test.data, type = "response")

我建立了一个混淆矩阵

createConfusionMatrix=function(actual, preds)
  predClass=ifelse(preds<0.5, 0, 1)

  table(actual,predClass)

## Confusion matrix 
createConfusionMatrix(test.data$Group,pred)

我的输出

              predClass
actual           0   1
  multiplex      0   0
  subterraneus   0   0
  unknown       70 129

我觉得这个输出不对?

我可以获得有关如何构建混淆矩阵的帮助吗?

【问题讨论】:

也许这有帮助:***.com/questions/25497398/… @jottbe 我试过这个方法。它对我不起作用。 【参考方案1】:

您的代码正在运行(使用您共享的数据):

#Code
i <- sample(1:3,288,replace = T)
#Data
microtus <- df[i,]
#Split
train.data = microtus[c(1:89),]
test.data = microtus[c(90:288),]
train.data$Group =ifelse(train.data$Group=="multiplex", 1, 0)
#Model
model <- glm(Group ~ M1 + M2 + Fora + len + height, 
             family = binomial(), data = train.data)
#Predict
test.data$pred <- predict(model, test.data, type = "response")
#Check
createConfusionMatrix=function(actual, preds)
  predClass=ifelse(preds<0.5, 0, 1)
  
  table(actual,predClass)

## Confusion matrix 
createConfusionMatrix(test.data$Group,test.data$pred)

输出:

              predClass
actual          0  1
  multiplex     0 75
  subterraneus 57  0
  unknown      67  0

使用的一些数据:

#Data
df <- structure(list(Group = c("multiplex", "subterraneus", "unknown"
), M1 = c(2078L, 1749L, 1841L), M2 = c(1649L, 1482L, 1562L), 
    Fora = c(1708L, 1462L, 1585L), Phone = c(3868L, 3797L, 3750L
    ), len = c(5463L, 4855L, 5024L), height = c(2355L, 2218L, 
    2232L), Rost = c(805L, 765L, 821L)), class = "data.frame", row.names = c("1", 
"2", "3"))

也许开始一个新的会话,然后再试一次。

【讨论】:

以上是关于逻辑模型的混淆矩阵的主要内容,如果未能解决你的问题,请参考以下文章

机器学习100天(十九):019 分类模型评价指标-混淆矩阵

混淆矩阵:真负数为 0 是啥意思?

Python混淆矩阵中的模型精度为0%

怎么计算混淆矩阵的消费者精度

R语言编写自定义函数计算分类模型评估指标:准确度特异度敏感度PPVNPV数据数据为模型预测后的混淆矩阵比较多个分类模型分类性能(逻辑回归决策树随机森林支持向量机)

Confusion Matrix混淆矩阵