深度学习目标检测网络结构MASK RCNN FPN

Posted Sun7_She

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习目标检测网络结构MASK RCNN FPN相关的知识,希望对你有一定的参考价值。

其相对于FASTER RCNN改进如下:

1. 分割,检测,分类同时进行

2. 引入ROI ALIGN(对分类影响不大,对分割影响大,因为ROI POOLING对应回图像中的像素会有偏差,该方法会相对准确)代替faster rcnn中的ROI POOLING

ROI ALIGN: https://www.cnblogs.com/wangyong/p/8523814.html

对于检测图片中大目标物体时,两种方案的差别不大,而如果是图片中有较多小目标物体需要检测,则优先选择RoiAlign,更精准些

3. 引入语义分割分支,实现mask和class预测关系的解耦。mask分支只做语义分割,类型预测的任务交给另一个分支(与FCN不同:FCN分类与分割同时,预测分割的时候也预测分类,不同的channel是不同的类别的分割概率)

 

 

FPN通过结合bottom-up,top-down方法获得较强的语义特征,提高目标检测和实例分割在多个数据集上面的性能表现。

FPN可以应用到前边的网络结构(fast, faster, mask rcnn)中

FPN: https://blog.csdn.net/WZZ18191171661/article/details/79494534

MAP: https://www.cnblogs.com/klitech/p/9242700.html

 

 

以上是关于深度学习目标检测网络结构MASK RCNN FPN的主要内容,如果未能解决你的问题,请参考以下文章

『计算机视觉』Mask-RCNN_关键点检测分支(待续)

深度学习目标检测网络结构SSD RETINANET

目标检测系列 Mask R-CNN—FPN

实战深度学习目标检测:RCNN

深度学习目标检测网络结构SPP FAST-RCNN FASTER-RCNN

深度学习之目标检测常用算法原理+实践精讲 YOLO / Faster RCNN / SSD / 文本检测 / 多任务网络