如何解释逻辑回归的系数和截距

Posted

技术标签:

【中文标题】如何解释逻辑回归的系数和截距【英文标题】:How to interpret coefficients and intercepts of logistic regression 【发布时间】:2019-02-12 00:17:40 【问题描述】:

我正在运行 Iris 数据集...我有四个特征和一个目标 多变的。我只得到三个拦截而不是四个 在这种情况下,请 coef_。

代码:

from sklearn.linear_model import LogisticRegression
lr=LogisticRegression()
lr.fit(train_x,train_y)

结果:

    lr.coef_
    output-
    array([[ 0.37158254,  1.35098324, -2.09936396, -0.93263471],
       [ 0.46758048, -1.57259888,  0.39692171, -1.0678223 ],
       [-1.52865509, -1.43245908,  2.30484329,  2.08586834]])

   lr.intercept_
   output-
   array([ 0.23818179,  1.0298293 , -1.04654308])

【问题讨论】:

【参考方案1】:

拦截取决于类的数量,而不是特征的数量。 请参阅文档here。

鸢尾花数据集根据official documentation分为3类。

因此,我觉得一切都很好。

截距是添加到决策函数中的偏差。您可以将fit_intercept 设置为False 以查看分类结果在有和没有截距的情况下有何变化。

【讨论】:

以上是关于如何解释逻辑回归的系数和截距的主要内容,如果未能解决你的问题,请参考以下文章

在多项逻辑回归中解释系数矩阵、截距向量和混淆矩阵

在线性回归中使用现有系数和截距

逻辑回归模型系数

当特征系数的符号在逻辑回归中发生变化时,如何根据特征系数做出决策/解释结果?

python逻辑回归(初级)

2—线性逻辑回归