yolo 算法 网格的两个bounding box大小是怎么确定的

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了yolo 算法 网格的两个bounding box大小是怎么确定的相关的知识,希望对你有一定的参考价值。

我感觉是训练出来的,输出的数据里面有bbox的x,y,w,h,然后将预测出来的x,y,w,h和真实值比较,通过反向传播修改前面神经网路的参数,经过多次迭代,就能得到理想的bbox。在测试时训练好的神经网络看到当前网格的一些信息,就能推测出应该用怎么的bbox。我刚刚也在想这个问题,突然想到这种解释,也不知道对不对。 参考技术A 在最终的输出tensor中,包含了两个bounding box的x,y,width,height信息(只不过,x,y是相对于某grid的偏移量,width,height是相对于图片宽/高的比例),很显然,有这几个信息就足以确定bbox的大小和位置了。本回答被提问者采纳 参考技术B 让电脑自动比对一下就可以确定大小的

yolo算法是指啥?

YOLO (You Only Look Once),是一个用于目标检测的网络。

目标检测任务包括确定图像中存在某些对象的位置,以及对这些对象进行分类。以前的方法,比如R-CNN和它的变种,使用一个管道在多个步骤中执行这个任务。这可能运行缓慢,也很难优化,因为每个单独的组件都必须单独训练。

特点

YOLO将对象检测重新定义为一个回归问题。它将单个卷积神经网络(CNN)应用于整个图像,将图像分成网格,并预测每个网格的类概率和边界框。

该算法还可以预测边界框中存在对象的概率。如果一个对象的中心落在一个网格单元中,则该网格单元负责检测该对象。每个网格中将有多个边界框。在训练时,我们希望每个对象只有一个边界框。因此,我们根据哪个Box与ground truth box的重叠度最高,从而分配一个Box来负责预测对象。

参考技术A

YOLO是一种目标检测的算法。
YOLO将对象检测重新定义为一个回归问题,所以它非常快,不需要复杂的管道。它比“R-CNN”快1000倍,比“Fast R-CNN”快100倍。能够处理实时的视频流,延迟能够小于25毫秒,精度是以前实时系统的两倍多,YOLO遵循的是“端到端深度学习”的实践。它将单个卷积神经网络(CNN)应用于整个图像,将图像分成网格,并预测每个网格的类概率和边界框。

例如,以一个100x100的图像为例。我们把它分成网格,比如7x7。然后,对于每个网格,网络都会预测一个边界框和与每个类别(汽车,行人,交通信号灯等)相对应的概率。

以上是关于yolo 算法 网格的两个bounding box大小是怎么确定的的主要内容,如果未能解决你的问题,请参考以下文章

边框回归边框回归(Bounding Box Regression)详解(转)

yolo算法是指啥?

YOLO 对象检测:算法如何预测比网格单元更大的边界框?

视觉检测中的YOLO家族算法是一种两步检测的方法,对吗

2. 滑动窗口和 Bounding Box 预测

计算机视觉算法整理:Faster RCNN,bounding box regression,IOU,GIOU