语义分割(4)Faster RCNN

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了语义分割(4)Faster RCNN相关的知识,希望对你有一定的参考价值。

参考技术A 由于之前的RCNN或是SPPnet或是FasterRCNN都是利用select search来做Region proposal的,即使把这种算法移植到GPU上,这种算法也忽略了很多sharing computation的机会.所以这篇文章提出了Region Proposal Network(RPN),只利用深度学习网络来训练得到Region Proposal.

RPN 的输入是一张照片,输出是一个长方形的区域,以及这个区域是否为物体的得分.

具体计算原理是先对VGG等常规网络最后的卷积层后加入3*3的小卷积,作为一个滑动窗口,然后分别再做两次1*1的卷积,得到anchor box分别是否为物体,以及他对应的候选区域的长方形.对于每一个feature map,我们这里可以得到9个anchor.

最后在经过一个loss function做整体优化.

具体细节,参考:

MaskLab-实例分割(使用语义分割和方向特征精细化目标检测)

MaskLab: Instance Segmentation by Refining Object Detection with Semantic and Direction Features
  这是一篇2018年cvpr关于实例分割的网络模型,模型主要有三个输出:边界框、语义分割、方向预测。

技术分享图片

整体框架

  整个模型使用ResNet-101作为特征提取器,构建于Faster-RCNN之上。使用Faster-RCNN检测到目标框之后,使用相应的类别选取对应的语义通道并裁剪,接着结合方向预测再通过1x1的卷积得到粗分割掩码。

技术分享图片

 

语义和方向特征

  Masklab最核心的地方是使用了方向特征。目标检测和语义分割可以用于不同类别的实例分割,方向特征则用于同一类别的实例分割,如同一边框中重叠的人。方向预测对数用于预测每个像素相对于它对应的实例中心的方向,进而用于分割同样语义标签的实例。

技术分享图片

掩码精细化

  这部分工作感觉就是锦上添花的东西。使用额外的几个卷积层组成的网络使用一种hypercolumn特征得到精细化的分割结果。


以上是关于语义分割(4)Faster RCNN的主要内容,如果未能解决你的问题,请参考以下文章

R-CNN论文翻译——用于精确物体定位和语义分割的丰富特征层次结构

图像语义分割标注工具labelme制作自己的数据集用于mask-rcnn训练

图像语义分割标注工具labelme制作自己的数据集用于mask-rcnn训练

Pytorch实现的语义分割器

Github 代码实践:Pytorch 实现的语义分割器

深度学习语义分割篇——FCN原理详解篇