SPSS中逻辑回归的预测概率是怎么算的

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SPSS中逻辑回归的预测概率是怎么算的相关的知识,希望对你有一定的参考价值。

参考技术A 根据公式计算的,p/1-p 参考技术B 拟合方程以后计算的P

在逻辑回归中预测具有最高可能概率的某个标签

【中文标题】在逻辑回归中预测具有最高可能概率的某个标签【英文标题】:Predict certain label with highest possible probability in logistic regression 【发布时间】:2018-03-02 03:36:35 【问题描述】:

我正在使用 sklearn 中的逻辑回归构建模型,具有 12 个参数和 0,1 标签。我需要对标签 0 非常有信心,如果某些“0”会被错误分类为 1,我可以。这样做的目的是,如果数据被分类为 0,我想从处理中排除数据。

如何调整参数?

【问题讨论】:

您的陈述:I need to be very confident about label 0, I am ok if some '0' will be missclassified to 1. 是矛盾的。首先,您是说您需要对标签 0 非常确定,然后您说可以对其进行错误分类。 抱歉泄露。换句话说,我想确定:如果我的测试数据为 0,那么概率非常高,接近 99%,但如果我得到 1,我可以接受较低的概率。有意义吗? 【参考方案1】:

您基本上是在寻找特异性,它被定义为TN/(TN+FP),其中 TN 是 True Negative 而 FP 是 False Positive。您可以在 blog post 中了解更多相关信息,在 detail here 中了解更多信息。要实现这一点,您需要在 sklearn 中使用 make_scorer 和 confusion_matrix metric,如下所示:

from sklearn.metrics import confusion_matrix
from sklearn.metrics import make_scorer

def get_TN_rate(y_true,y_pred):
    tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel()
    specificity = float(tn)/(float(tn)+float(fp))
    return specificity

tn_rate = make_scorer(get_TN_rate,greater_is_better=True)

现在您可以使用tn_rate 作为评分函数来训练您的分类器。

【讨论】:

您将如何在LogisticRegression 模型中使用此记分器?我找不到任何理由把它放进去。

以上是关于SPSS中逻辑回归的预测概率是怎么算的的主要内容,如果未能解决你的问题,请参考以下文章

在逻辑回归中预测具有最高可能概率的某个标签

逻辑回归--计算概率

逻辑回归(Logistic Regression, LR)

spss模型预测准确率是哪个

使用逻辑回归模型获得 1 而不是 [0;1] 的预测概率

如何用spss做多因素回归分析