浅谈人脸识别中的loss 损失函数

Posted think90

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了浅谈人脸识别中的loss 损失函数相关的知识,希望对你有一定的参考价值。

浅谈人脸识别中的loss 损失函数

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/u012505617/article/details/89355690

 

在人脸识别中,算法的提高主要体现在损失函数的设计上,损失函数会对整个网络的优化有着导向性的作用。我们看到许多常用的损失函数,从传统的softmax loss到cosface, arcface 都有这一定的提高,这篇文章自己就来整理下这几个算法。

无论是SphereFace、CosineFace还是ArcFace的损失函数,都是基于Softmax loss来进行修改的。

 

Base line Softmax loss
各种延伸的算法 Triplet loss, center loss
最新算法 A-Softmax Loss(SphereFace),  Cosine Margin Loss, Angular Margin Loss, Arcface

1. Softmax loss

    技术图片

这就是softmax loss函数,技术图片表示全连接层的输出。在计算Loss下降的过程中,我们让技术图片 的比重变大,从而使得log() 括号内的数更变大来更接近1,就会 log(1) = 0,整个loss就会下降。

技术图片

这种方式只考虑了能否正确分类,却没有考虑类间距离。所以提出了center loss 损失函数。(paper)

 

2. Center loss

    技术图片

    技术图片

center loss 考虑到不仅仅是分类要对,而且要求类间有一定的距离。上面的公式中技术图片表示某一类的中心,技术图片表示每个人脸的特征值。作者在softmax loss的基础上加入了技术图片,同时使用参数技术图片来控制类内距离,整体的损失函数如下:

    技术图片

技术图片

 

3. Triplet Loss

技术图片

三元组损失函数,三元组由Anchor, Negative, Positive这三个组成。从上图可以看到,一开始Anchor离Positive比较远,我们想让Anchor和Positive尽量的靠近(同类距离),Anchor和Negative尽量的远离(类间距离)。

    技术图片

表达式左边为同类距离 ,右边为不同的类之间的距离。使用梯度下降法优化的过程就是让类内距离不断下降,类间距离不断提升,这样损失函数才能不断地缩小。

上面的几个算法都是比较传统老旧的,下面说一下比较新的算法。


 

4. L-softmax

前面Softmax loss函数没有考虑类间距离,Center loss函数可以使类内变得紧凑,但没有类间可分,而Triplet loss函数比较耗时,就产生了一下新的算法。

L-softmax函数开始就做了比较精细的改动,从softmax 函数log里面的技术图片转化到技术图片。L-softmax函数不仅希望类间距离拉的更大,还能够把类内距离压缩的更紧凑。

    技术图片 

    技术图片

把其中的cosθ改成了cos(mθ),

    技术图片

m倍θ起到了增加 margin 的效果,让类内距离更加紧凑,同时类间距离变大。m越大类间距离就越大,因为在(0, π)区间cos函数单调递减,m越大 cos(mθ)趋向于0。

技术图片

 

5. SphereFace(A-Softmax)

A-softmax 是在 L-softmax 函数上做了一个很小的修改,A-softmax 在考虑 margin时添加两个限制条件:将权重W归一化 技术图片,b = 0。这使得模型的预测仅取决于 W 和 X 之间的角度。

    技术图片

 

6. CosFace

cosface的loss函数如下:

    技术图片

上式中,s为超球面的半径,m为margin。

 

7. ArcFace

对比arcface和cosface这两个函数,发现arcface是直接在角度空间中最大化分类界限,而cosface是在余弦空间中最大化分类界限,这样修改是因为角度距离比余弦距离在对角度的影响更加直接。  

技术图片

 

分类的决策边界如下:

技术图片

 arcface算法流程如下:

技术图片

 

以上是关于浅谈人脸识别中的loss 损失函数的主要内容,如果未能解决你的问题,请参考以下文章

人脸识别-arcface损失函数

人脸识别人脸识别损失函数学习笔记

浅谈人脸识别技术的方法和应用

人脸识别方法综述

浅谈动态人脸识别技术原理

基于QT和OpenCV的人脸检测识别系统