Yolo 一文看懂目标检测

Posted 我是小白呀

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Yolo 一文看懂目标检测相关的知识,希望对你有一定的参考价值。

概述

Yolo (You Only Look Once) 是目标检测 one-state 的一种神经网络. Yolo 可以帮助我们在图片中找出特定物体, 并识别种类和位置.
在这里插入图片描述

one-stage

  • 典型代表: yolo
  • 优点: 速度快, 可以实时检测
  • 缺点: 效果不如 two-stage

two-stage

  • 经典代表: Mask-Rcnn
  • 优点: 效果好
  • 缺点: 速度慢

Yolo 原理

核心思想:
在这里插入图片描述

分割图片

Yolo 会首先将图片分割成一个 S * S 的网格.
在这里插入图片描述
如图, 图片被分割成了 7 * 7 的网格.

预选框

图片呗分成了 49 个框, 每个框包含 2 个预选框 (bounding box).
在这里插入图片描述
完整的图:
在这里插入图片描述
如图, 总共有 2 * 49 = 98 个预选框. 其中置信度比较高的框会较粗, 置信度低的较细.

计算参数

在这里插入图片描述

其中每个网格包含 2 * 5 (x, y, w, h, c) + 20 个类别.

  • 2: 2 个预选框
  • x, y 为物体的中心点
  • w, h 为物体的长宽
  • c (confidence): 置信度

在这里插入图片描述

总共有 7 * 7 * 30 = 49 * 30 个参数.

预测物体

类别的概率 = 在物体中是类别的概率 * 是物体的概率:
在这里插入图片描述
例如: 物体是狗的概率是 0.7, 是物体的概率是 0.8 => 是狗狗的概率是 0.7 * 0.8 = 0.56

在这里插入图片描述

得到结果

在这里插入图片描述

网络架构 (v1)

在这里插入图片描述

以上是关于Yolo 一文看懂目标检测的主要内容,如果未能解决你的问题,请参考以下文章

目标检测评价指标(一文看懂)

目标检测评价指标(一文看懂)

一文带你学会使用YOLO及Opencv完成图像及视频流目标检测(上)|附源码

目标检测算法图解:一文看懂RCNN系列算法

yolo系列

目标检测 YOLO系列——YOLO v1