yolo 算法网格的两个bounding box大小是怎么确定的

Posted 2023-03-17

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了yolo 算法网格的两个bounding box大小是怎么确定的相关的知识，希望对你有一定的参考价值。

我感觉是训练出来的，输出的数据里面有bbox的x,y,w,h，然后将预测出来的x,y,w,h和真实值比较，通过反向传播修改前面神经网路的参数，经过多次迭代，就能得到理想的bbox。在测试时训练好的神经网络看到当前网格的一些信息，就能推测出应该用怎么的bbox。我刚刚也在想这个问题，突然想到这种解释，也不知道对不对。参考技术A 在最终的输出tensor中，包含了两个bounding box的x,y,width,height信息（只不过，x,y是相对于某grid的偏移量，width,height是相对于图片宽/高的比例），很显然，有这几个信息就足以确定bbox的大小和位置了。本回答被提问者采纳参考技术B 让电脑自动比对一下就可以确定大小的

yolo算法是指啥？

YOLO (You Only Look Once)，是一个用于目标检测的网络。

目标检测任务包括确定图像中存在某些对象的位置，以及对这些对象进行分类。以前的方法，比如R-CNN和它的变种，使用一个管道在多个步骤中执行这个任务。这可能运行缓慢，也很难优化，因为每个单独的组件都必须单独训练。

特点

YOLO将对象检测重新定义为一个回归问题。它将单个卷积神经网络(CNN)应用于整个图像，将图像分成网格，并预测每个网格的类概率和边界框。

该算法还可以预测边界框中存在对象的概率。如果一个对象的中心落在一个网格单元中，则该网格单元负责检测该对象。每个网格中将有多个边界框。在训练时，我们希望每个对象只有一个边界框。因此，我们根据哪个Box与ground truth box的重叠度最高，从而分配一个Box来负责预测对象。

参考技术A

YOLO是一种目标检测的算法。
YOLO将对象检测重新定义为一个回归问题，所以它非常快，不需要复杂的管道。它比“R-CNN”快1000倍，比“Fast R-CNN”快100倍。能够处理实时的视频流，延迟能够小于25毫秒，精度是以前实时系统的两倍多，YOLO遵循的是“端到端深度学习”的实践。它将单个卷积神经网络（CNN)应用于整个图像，将图像分成网格，并预测每个网格的类概率和边界框。

例如，以一个100x100的图像为例。我们把它分成网格，比如7x7。然后，对于每个网格，网络都会预测一个边界框和与每个类别（汽车，行人，交通信号灯等）相对应的概率。

以上是关于yolo 算法网格的两个bounding box大小是怎么确定的的主要内容，如果未能解决你的问题，请参考以下文章

yolo 算法 网格的两个bounding box大小是怎么确定的

yolo算法是指啥？

yolo 算法网格的两个bounding box大小是怎么确定的