二分类逻辑回归及案例

Posted lucylucy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了二分类逻辑回归及案例相关的知识,希望对你有一定的参考价值。

一、模型的构建

银行在放贷之前都会对客户做一个评估,来判定其是否有大概率会违约。这里我们用1表示其不会违约,用0表示会违约,假设影响因素有m个。

逻辑回归的目的是得到一个p(概率),如果给定一个临界值就可判断其属于哪一类,一般默认临界值为0.5,若p>0.5,则判定为第一类,既不会违约,若p<0.5,则判定为会违约。

sigmoid函数:    技术图片

 

 

 

 

技术图片

把z带入sigmoid函数:  技术图片

变换得到逻辑回归的模型:技术图片

 

于是逻辑回归模型可以视为分对数变换下关于X的一个线性模型

若将y视为不违约的可能性,则1-y是违约的可能性

技术图片

于是有:

技术图片

于是我们可以通过极大似然估计来估计:为了方便讨论:wTX+b可以简写为:βTX

极大似然估计拟合逻辑回归模型的基本思想是:寻找一组β的估计,代入模型中,使所有不违约的人的值接近于1,而违约的人值接近于0。

1.构建似然函数:

技术图片

2.取对数,即对数拟然函数。

3.求偏导。令其为 0,解方程组,求得对应一组回归参数?? ?? 的最优解。

二、模型的解释:

ln(p/ (1-pi))=βTX

假设模型中只包含一个自变量:

技术图片

等式两侧同时取对数的反函数:

技术图片

 

 两等式相除:

技术图片

 

e??1 表示为,x 每增加一个单位风险增加的倍数,如果??1 为 0.44,即e??1为 1.53,解释为其他变量处于控制状态下,x每增加一个单位,判断为不违约的概率比原来增加了1.53倍。

三、模型的评估:

roc曲线

1.混淆矩阵:

技术图片

 

 TPR=TP/(TP+FN)

FPR=FP/(FP+TN)

 roc曲线:

auc:

 

 

 

 

 

 

 

以上是关于二分类逻辑回归及案例的主要内容,如果未能解决你的问题,请参考以下文章

机器学习:理解逻辑回归及二分类多分类代码实践

分类算法 之 逻辑回归--理论+案例+代码

分类算法-逻辑回归与二分类

6-1 逻辑回归 二分类逻辑回归模型

6-1 逻辑回归 二分类逻辑回归模型

6-1 逻辑回归 二分类逻辑回归模型