Yolo 一文看懂目标检测
Posted 我是小白呀
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Yolo 一文看懂目标检测相关的知识,希望对你有一定的参考价值。
概述
Yolo (You Only Look Once) 是目标检测 one-state 的一种神经网络. Yolo 可以帮助我们在图片中找出特定物体, 并识别种类和位置.
one-stage
- 典型代表: yolo
- 优点: 速度快, 可以实时检测
- 缺点: 效果不如 two-stage
two-stage
- 经典代表: Mask-Rcnn
- 优点: 效果好
- 缺点: 速度慢
Yolo 原理
核心思想:
分割图片
Yolo 会首先将图片分割成一个 S * S 的网格.
如图, 图片被分割成了 7 * 7 的网格.
预选框
图片呗分成了 49 个框, 每个框包含 2 个预选框 (bounding box).
完整的图:
如图, 总共有 2 * 49 = 98 个预选框. 其中置信度比较高的框会较粗, 置信度低的较细.
计算参数
其中每个网格包含 2 * 5 (x, y, w, h, c) + 20 个类别.
- 2: 2 个预选框
- x, y 为物体的中心点
- w, h 为物体的长宽
- c (confidence): 置信度
总共有 7 * 7 * 30 = 49 * 30 个参数.
预测物体
类别的概率 = 在物体中是类别的概率 * 是物体的概率:
例如: 物体是狗的概率是 0.7, 是物体的概率是 0.8 => 是狗狗的概率是 0.7 * 0.8 = 0.56
得到结果
网络架构 (v1)
以上是关于Yolo 一文看懂目标检测的主要内容,如果未能解决你的问题,请参考以下文章