一个门外汉的理解 ~ Faster R-CNN

Posted Mu001999

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一个门外汉的理解 ~ Faster R-CNN相关的知识,希望对你有一定的参考价值。

 首先放R-CNN的原理图

显然R-CNN的整过过程大致上划分为四步:

  1.输入图片

  2.生成候选窗口

  3.对局部窗口进行特征提取(CNN)

  4.分类(Classify regions)

而R-CNN的缺陷就在于对每个候选窗口都要进行特征提取,造成了计算时间成本很大。

再放Fast R-CNN的原理图

Fast R-CNN的提高速度的关键就在于将proposal的region映射到CNN的最后一层conv layer的feature map上,意味着一张图片只需要进行一次特征提取。

而既然R-CNN系列已经发展到了Faster,所以我选择直接用Faster R-CNN,而且Faster可以直接做到实时检测目标(速度能达到在视频中实时检测目标)。

且Faster R-CNN的最大改变就是不使用selective search,而是通过所谓的Region ProposalNetwork(RPN),即通过卷积神经网络直接产生region proposal

 RPN的作用就是:

(1) 输出proposal的位置(坐标)和score 

(2) 将不同scale和ratio的proposal映射为低维的feature vector 
(3) 输出是否是前景的classification和进行位置的regression

以上是关于一个门外汉的理解 ~ Faster R-CNN的主要内容,如果未能解决你的问题,请参考以下文章

Faster-RCNN理解

Faster R-CNN:详解目标检测的实现过程

论文解读Faster R-CNN 实时目标检测

FCOS及其和Faster R-CNN的区别

论文解读Faster R-CNN 实时目标检测

R-CNN,faster R-CNN,yolo,SSD,yoloV2,yoloV3