你对YOLOV3损失函数真的理解正确了吗？

Posted 2022-05-23 wx61de9b3447ec7

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了你对YOLOV3损失函数真的理解正确了吗？相关的知识，希望对你有一定的参考价值。

1. 前言

昨天行云大佬找到我提出了他关于GiantPandaCV公众号出版的《从零开始学YOLOV3》电子书中关于原版本的YOLOV3损失的一个质疑，并给出了他的理解。昨天晚上我仔细又看了下原始论文和DarkNet源码，发现在YOLOV3的原版损失函数的解释上我误导了不少人。所以就有了今天这篇文章，与其说是文章不如说是一个错误修正吧。

2. 在公众号里面的YOLOV3损失函数

在我们公众号出版的YOLOV3的PDF教程里对原始的DarkNet的损失函数是这样解释的，这个公式也是我参照源码（https://github.com/BBuf/Darknet/blob/master/src/yolo_layer.c）进行总结的，。我的总结截图如下：

你对YOLOV3损失函数真的理解正确了吗？_方差

其中表示，表示,, 。B代表box，表示如果在处的box有目标，其值为，否则为。表示如果处的box没有目标，其值为，否则为。

BCE（binary cross entropy）的具体公式计算如下：

另外，针对YOLOV3，回归损失会乘以一个的比例系数，和代表Ground Truth box的宽高，如果没有这个系数AP会下降明显，大概是因为COCO数据集小目标很多的原因。

我根据DarkNet的源码对每一步进行了梯度推导发现损失函数的梯度是和上面的公式完全吻合的，所以当时以为这是对的，感谢行云大佬提醒让我发现了一个致命理解错误，接下来我们就说一下。

3. 行云大佬的损失函数公式

接下来我们看一下行云大佬的损失函数公式，形式如下：

你对YOLOV3损失函数真的理解正确了吗？_损失函数_02

可以看到我的损失函数理解和行云大佬的损失函数理解在回归损失以及分类损失上是完全一致的，只有obj loss表示形式完全不同。对于obj loss，我的公式里面是方差损失，而行云大佬是交叉熵损失。那么这两种形式哪一种是正确的呢？

其实只要对交叉熵损失和方差损失求个导问题就迎刃而解了。

4. 交叉熵损失求导数

推导过程如下：

(1)softmax函数

首先再来明确一下softmax函数，一般softmax函数是用来做分类任务的输出层。softmax的形式为:

其中表示的是第i个神经元的输出，接下来我们定义一个有多个输入，一个输出的神经元。神经元的输出为

其中是第个神经元的第个权重,b是偏移值.表示网络的第个输出。给这个输出加上一个softmax函数，可以写成:

其中表示softmax函数的第个输出值。这个过程可以用下图表示:

你对YOLOV3损失函数真的理解正确了吗？_公众号_03

(2)损失函数

softmax的损失函数一般是选择交叉熵损失函数，交叉熵函数形式为：

其中y_i表示真实的标签值

(3)需要用到的高数的求导公式

c=0(c为常数）
(x^a)=ax^(a-1),a为常数且a≠0
(a^x)=a^xlna
(e^x)=e^x
(logax)=1/(xlna),a>0且 a≠1
(lnx)=1/x
(sinx)=cosx
(cosx)=-sinx
(tanx)=(secx)^2
(secx)=secxtanx
(cotx)=-(cscx)^2
(cscx)=-csxcotx
(arcsinx)=1/√(1-x^2)
(arccosx)=-1/√(1-x^2)
(arctanx)=1/(1+x^2)
(arccotx)=-1/(1+x^2)
(shx)=chx
(chx)=shx
（uv)=uv+uv
(u+v)=u+v
(u/)=(uv-uv)/^2