《统计学习方法》--逻辑斯谛回归模型
Posted 兜里有糖心里不慌
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《统计学习方法》--逻辑斯谛回归模型相关的知识,希望对你有一定的参考价值。
《统计学习方法》第六章–逻辑斯谛回归模型
逻辑斯谛回归概述
逻辑斯谛回归的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“回归”一词源于最佳拟合,表示要找到最佳拟合参数。而最佳拟合参数就是在训练分类器时,通过最优化算法获得。
逻辑斯谛分布
设 X X X是连续随机变量, X X X服从逻辑斯谛分布是指 X X X具有以下分布函数和概率密度函数: F ( x ) = P ( X ≤ x ) = 1 1 + e − ( x − μ ) / γ F(x)=P(X\\leq x)=\\frac11+e^-(x-\\mu)/\\gamma F(x)=P(X≤x)=1+e−(x−μ)/γ1 f ( x ) = F ′ ( x ) = e − ( x − μ ) / γ γ ( 1 + e − ( x − μ ) / γ ) 2 f(x)=F'(x)=\\frace^-(x-\\mu)/\\gamma\\gamma(1+e^-(x-\\mu)/\\gamma)^2 f(x)=F′(x)=γ(1+e−(x−μ)/γ)2e−(x−μ)/γ其中 μ \\mu μ为位置参数, γ > 0 \\gamma \\gt 0 γ>0为形状参数
二项式逻辑斯谛回归模型
P ( Y = 1 ∣ x ) = e x p ( ω ⋅ x + b ) 1 + e x p ( ω ⋅ x + b ) P(Y=1|x) = \\fracexp(\\omega\\cdot x+b)1+exp(\\omega\\cdot x+b) P(Y=1∣x)=1+exp(ω⋅x+b)exp(ω⋅x+b) P ( Y = 0 ∣ x ) = 1 1 + e x p ( ω ⋅ x + b ) P(Y=0|x) = \\frac11+exp(\\omega\\cdot x+b) P(Y=0∣x)=1+exp(ω⋅x+b)1
这里 x ∈ R n x\\in R^n x∈Rn是输入, Y ∈ 0 , 1 Y\\in\\0,1\\ Y∈0,1是输出, ω ∈ R n \\omega\\in R^n ω∈Rn和 b ∈ R n b\\in R^n b∈Rn是参数, ω \\omega ω称为权值向量, b b b称为偏置, ω ⋅ x \\omega\\cdot x ω⋅x是 ω \\omega ω和 X X X的內积
对于给定的输入实例 X X X,按照上式可以求得实例属于两种类别的概率,逻辑斯谛回归模型比较两个概率的大小,将实例归入概率较大的那一类中。
模型参数估计
对于给定的训练数据集 T = ( x 1 , y 1 ) , ( x 2 , y 2 ) . . . ( x N , y N ) T=\\(x_1,y_1),(x_2,y_2)...(x_N,y_N)\\ T=(x1,y1),(x2,y2)...(xN,yN)其中 x i ∈ R n , y i ∈ 0 , 1 x_i\\in R^n,y_i\\in \\0,1\\ xi∈Rn,yi∈0,1可以应用
极大似然估计
来得到模型的参数,从而得到逻辑斯谛回归模型。
设 P ( Y = 1 ∣ x ) = π ( x ) , P ( Y = 0 ∣ x ) = 1 − π ( x ) P(Y=1|x)=\\pi(x),P(Y=0|x)=1-\\pi(x) P(Y=1∣x)=π(x),P(Y=0∣x)=1−π(x)则可得似然函数 ∏ i = 1 N [ π ( x i ) ] y i [ 1 − π ( x i ) ] 1 − y i \\prod_i=1^N[\\pi(x_i)]^y_i[1-\\pi(x_i)]^1-y_i i=1∏N[π(xi)]yi[1−π(xi)]1−yi对数似然函数为: L ( ω ) = ∑ i = 1 N [ y i log π ( x ) + ( 1 − y i log ( 1 − π ( x i ) ) ) ] L(\\omega)=\\sum_i=1^N[y_i\\log\\pi(x)+(1-y_i\\log(1-\\pi(x_i)))] L(ω)=i=1∑N[yilogπ(x)+(1−yilog(1−π(xi)))]即最终变成求解 L ( ω ) L(\\omega) L(ω)极大值的问题。一般可以采用
梯度下降
或者是拟牛顿法
求解
最后求出 ω \\omega ω的极大似然估计值即可得到逻辑斯谛回归模型。
多项式逻辑斯谛回归
二项式逻辑斯谛回归应用于二类分类问题,将其推广到多项式逻辑斯谛回归就可以应用于多类分类问题。
假设离散型随机变量 Y Y Y的取值集合是 1 , 2 , . . . , K \\1,2,...,K\\ 1,2,...,K则多项式逻辑斯谛回归模型是 P ( Y = k ∣ x ) = exp ( ω k ⋅ x ) 1 + ∑ k = 1 K − 1 exp ( ω k ⋅ x ) , k = 1 , 2 , 3... , K − 1 P(Y=k|x)=\\frac\\exp(\\omega_k\\cdot x)1+\\sum_k=1^K-1\\exp(\\omega_k \\cdot x), k=1,2,3...,K-1 P(Y=k∣x)=1+∑k=1K−1exp(ωk⋅x)exp(ωk
以上是关于《统计学习方法》--逻辑斯谛回归模型的主要内容,如果未能解决你的问题,请参考以下文章