7Logistic回归

Posted 2021-01-30 jp-mao

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了7Logistic回归相关的知识，希望对你有一定的参考价值。

logistic回归是使用最多的分类算法

二分类

预测值：yε{0, 1}, 0代表负类(No, 假设不成立)；1代表正类(Yes，假设成立)

应用：邮件分类(垃圾邮件 or 非垃圾邮件)

假设函数

logistic函数又称Sigmoid函数，是一个在生物学中常见的S型函数，也称为S型生长曲线。由于其单增以及反函数单增等性质，常被用作神经网络等阀值函数，将变量映射到0-1之间，所以logistic函数到预测值：0≤y≤1

logistic方程式：g(z) = 1/(1 + e^-z)，0≤g(z)≤1

线性回归假设函数：h(x) = θ^Tx

所以，logistic假设函数：h(x) = g(θ^Tx) = 1/(1 + e^{-θ^Tx})，0≤h(x)≤1

logistic模型解释

因为预测值y只能取值0或者1，根据概率在给定参数θ下概率P(y=1)和P(y=0)的和为1，即：P(y=0;θ) + P(y=1;θ) = 1

决策界限

技术分享图片

根据logistic图形

h(z)≥0.5，y=1; 由h(z)=g(θ^Tx)≥0.5,推出z≥0, 即θTx≥0
h(z)<0.5，y=0；由h(z)=g(θ^Tx)<0.5,推出z<0, 即θTx<0

所以z=0是假设函数的决策界限，决策界限是假设函数的一个属性，它把假设函数图形分成两半：y=0和y=1

损失函数

训练集：{(x¹,y¹),(x²,y²),(x³,y³),...,(x^m,y^m)} ,m个样本

X = [x₀ x₁ ... x_m]^T, x₀=1, yε{0, 1}

h(x) = 1/(1 + e^{-θ^Tx})

线性回归损失函数：J(θ)=Σ(h(xⁱ)-yⁱ)²/m, iε{1, m}

令Cost(h(xⁱ),yⁱ)=(h(xⁱ)-yⁱ)²

所以，J(θ)=Σ(h(xⁱ)-yⁱ)²/m=ΣCost(h(xⁱ),yⁱ)/m, iε{1, m}

损失函数：

Cost(h(x), y)=-log(h(x)), y=1
Cost(h(x), y)= -log(1-h(x)), y=0

结合图形：

1、当y=1：

h(x)=1时，Cost=0，损失函数值最小
h(x)=0时，Cost=∞，损失函数值最大

2、当y=0:

h(x)=0时，Cost=0，损失函数值最小
h(x)=1时，Cost=∞，损失函数值最大

简化损失函数和梯度下降

J(θ)=Σ(h(xⁱ)-yⁱ)²/m=ΣCost(h(xⁱ),yⁱ)/m, iε{1, m}

Cost(h(x), y)=-log(h(x)), y=1

Cost(h(x), y)= -log(1-h(x)), y=0

简化损失函数：

Cost(h(x), y)=-log(h(x))-(1-y)log(1-h(x))

所以梯度下降：J(θ)=Σ(h(xⁱ)-yⁱ)²/m=-Σyⁱlog(h(xⁱ))+(1-yⁱ)log(1-h(xⁱ))/m, iε{1, m}

简化损失函数和梯度下降

minJ(θ): repeat{ θ_j := θ_j-α(?/?θ_j)J(θ)}

梯度下降和缩放同样适用于logistic回归

高级优化方法

cojugate gradient
BFGS
L-BFGS

以上三种算法的优点：不需要选择学习率，比梯度下降收敛速度快

缺点：比梯度下降算法复杂

多分类问题

简化为二分类问题来处理，比如三分类简化为三个二分类来处理

以上是关于7Logistic回归的主要内容，如果未能解决你的问题，请参考以下文章