深度学习目标检测网络结构SPP FAST-RCNN FASTER-RCNN
Posted Sun7_She
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习目标检测网络结构SPP FAST-RCNN FASTER-RCNN相关的知识,希望对你有一定的参考价值。
在讲fast-rcnn之前,我们先来看一下spp net吧?~
spp net对r-cnn的改进主要有两点:
1. 只对原图提取一次特征。输入是图片,在feature层对应位置找到候选框的位置。
2. 结合空间金字塔方法实现cnns的对不同尺度的输入。实现数据的多尺度输入。分别划分不同的小块对feature进行pooling。
对比r-cnn提速100倍左右
问题:如何训练提取特征的网络?
流程:选框,CNN,SVM,回归
fast rcnn:
解决的问题:输入很多图重复计算耗时。
解决办法:借鉴spp net的思想,1. 图片过一次网络,在特征层选框;2. 提出roi pooling,将候选框划分为2*2的区域,提取特征,保证所有候选框提取的特征都是一致的。
流程改动:没有SVM,roi pooling后边直接接分类和回归分支
faster rcnn:
解决的问题:选择性搜索,找出所有候选框也非常耗时。
解决办法:使用region proposal network(rpn)-->提取边缘的神经网络。
具体做法:将rpn放在最后一个卷积层的后面。rpn直接训练得到候选区域。
rpn具体算法详解:https://www.cnblogs.com/wangyong/p/8513563.html
非极大值抑制算法详解:https://blog.csdn.net/zchang81/article/details/70211851
流程改动:加RPN在特征层选框,最终确定大约300个概率较高的框继续向后做ROI POOLING等,NMS移到网络最后决定300个框留下哪几个
以上是关于深度学习目标检测网络结构SPP FAST-RCNN FASTER-RCNN的主要内容,如果未能解决你的问题,请参考以下文章
基于FAST-RCNN深度学习的目标识别算法的MATLAB仿真
深度学习完全攻略(连载二十一:目标检测方向深度学习技术路线总结)