TridentNet解读

Posted 爆米花好美啊

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TridentNet解读相关的知识,希望对你有一定的参考价值。

检测领域一直存在一个scale variation问题,大小物体对视野域的需要是不一样的,deformable cnn的作者daijifeng老师就提到一个说法:最好的视野域就是刚好“覆盖自己”,不要太大也不要太小。前人有3种途径

  • 利用RCNN去原图上扣proposal,强制使得所有物体的视野域就是自己 Revisiting RCNN: On Awakening the Classification Power of Faster RCNN
  • Deformable cnn,可变型卷积不同物体学习不同的视野域 论文中也有可视化的图 Deformable ConvNets v2
  • Image Pyramid SNIP系列 分三路RPN学习不同尺度的物体SNIP
  • Feature Pyramid FPN系列 能部分解决尺度问题,为了兼容大小物体,导致大小物体特征的“表达能力”都不是最强

    而本文TridentNet也算是分3路学习不同尺度的物体,不过不是将网络直接分成三路,因为SNIP这样的测试时间太慢了
  • 为了使模型对不同尺寸目标的“表达能力”近似,作者借鉴了SNIP的特征提取网络,采用了“scale-aware”的并行结构;
  • 为了加快模型的推理速度,作者采用了dilated convolution得到不同感受野的特征图,从而实现检测不同尺度目标的目的,取代了SNIP中的特征金字塔生成不同尺度目标的做法

从下图发现,不同dilation也即是不同视野域分别适应不同尺度的物体,大视野域对大物体友好,小视野域对小物体友好

效果贼好


以上是关于TridentNet解读的主要内容,如果未能解决你的问题,请参考以下文章

重磅!SimpleDet:简单通用的目标检测与物体识别框架(内附TridentNet开源代码)

经典论文解读YOLOv3 目标检测

经典论文解读YOLOv2 目标检测

经典论文解读YOLOv3 目标检测

经典论文解读YOLOv2 目标检测

物体检测的尺度效应实验