经典论文解读YOLO 目标检测
Posted 一颗小树x
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了经典论文解读YOLO 目标检测相关的知识,希望对你有一定的参考价值。
前言
YOLO是一种目标检测方法,它的输入是整张图片,当检测到目标物体时用边界框圈起来,同时给该目标物体一个类别;边界框由中心位置、宽、高等来表示的;它的输出是n个物体的检测信息,每个物体的信息包括:中心位置(x,y)、高(h)、宽(w)、类别。
YOLO的全称是you only look once,指只需要浏览一次就可以识别出图中的物体的类别和位置;它是通过归回的方式计算和优化边界框和类别。
论文地址:You Only Look Once: Unified, Real-Time Object Detection
开源代码:https://github.com/pjreddie/darknet
一、思路流程
- 输入一张图像,把图像划分为7*7的网格;此时图像由49个网格组成的。
- 对于每个网络,模型都预测2个边界框;每个边界框包含的信息:置信度、中心坐标、宽、高等。此时图像有7*7*2 = 98个边界框。
- 设置一个阈值,去除“置信度”过低的边界框;然后通过非极大值抑制来去除冗余的边界框。
二、网络结构
YOLO的结构比较简单,常规的卷积、池化最后加了两层全连接。画了一个草图,便于大家理解:
以上是关于经典论文解读YOLO 目标检测的主要内容,如果未能解决你的问题,请参考以下文章