深度学习目标检测网络结构SPP FAST-RCNN FASTER-RCNN

Posted Sun7_She

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习目标检测网络结构SPP FAST-RCNN FASTER-RCNN相关的知识,希望对你有一定的参考价值。

在讲fast-rcnn之前,我们先来看一下spp net吧?~

spp net对r-cnn的改进主要有两点:

        1. 只对原图提取一次特征。输入是图片,在feature层对应位置找到候选框的位置。

        2. 结合空间金字塔方法实现cnns的对不同尺度的输入。实现数据的多尺度输入。分别划分不同的小块对feature进行pooling。

对比r-cnn提速100倍左右

问题:如何训练提取特征的网络?

流程:选框,CNN,SVM,回归

 

fast rcnn:

解决的问题:输入很多图重复计算耗时。

解决办法:借鉴spp net的思想,1. 图片过一次网络,在特征层选框;2. 提出roi pooling,将候选框划分为2*2的区域,提取特征,保证所有候选框提取的特征都是一致的。

流程改动:没有SVM,roi pooling后边直接接分类和回归分支

 

faster rcnn:

解决的问题:选择性搜索,找出所有候选框也非常耗时。

解决办法:使用region proposal network(rpn)-->提取边缘的神经网络。

具体做法:将rpn放在最后一个卷积层的后面。rpn直接训练得到候选区域。

rpn具体算法详解:https://www.cnblogs.com/wangyong/p/8513563.html

非极大值抑制算法详解:https://blog.csdn.net/zchang81/article/details/70211851

流程改动:加RPN在特征层选框,最终确定大约300个概率较高的框继续向后做ROI POOLING等,NMS移到网络最后决定300个框留下哪几个

 

 

 

 

以上是关于深度学习目标检测网络结构SPP FAST-RCNN FASTER-RCNN的主要内容,如果未能解决你的问题,请参考以下文章

基于FAST-RCNN深度学习的目标识别算法的MATLAB仿真

滑动窗口与选择搜索

深度学习完全攻略(连载二十一:目标检测方向深度学习技术路线总结)

4. 基于深度学习的目标检测算法的综述(转)

11月深度学习班第5课图像物体检测:rcnn/fast-rcnn/faster-rcnn

目标检测-YOLOv3