TridentNet解读
Posted 爆米花好美啊
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TridentNet解读相关的知识,希望对你有一定的参考价值。
检测领域一直存在一个scale variation问题,大小物体对视野域的需要是不一样的,deformable cnn的作者daijifeng老师就提到一个说法:最好的视野域就是刚好“覆盖自己”,不要太大也不要太小。前人有3种途径
- 利用RCNN去原图上扣proposal,强制使得所有物体的视野域就是自己 Revisiting RCNN: On Awakening the Classification Power of Faster RCNN
- Deformable cnn,可变型卷积不同物体学习不同的视野域 论文中也有可视化的图 Deformable ConvNets v2
- Image Pyramid SNIP系列 分三路RPN学习不同尺度的物体SNIP
- Feature Pyramid FPN系列 能部分解决尺度问题,为了兼容大小物体,导致大小物体特征的“表达能力”都不是最强
而本文TridentNet也算是分3路学习不同尺度的物体,不过不是将网络直接分成三路,因为SNIP这样的测试时间太慢了 - 为了使模型对不同尺寸目标的“表达能力”近似,作者借鉴了SNIP的特征提取网络,采用了“scale-aware”的并行结构;
- 为了加快模型的推理速度,作者采用了dilated convolution得到不同感受野的特征图,从而实现检测不同尺度目标的目的,取代了SNIP中的特征金字塔生成不同尺度目标的做法
从下图发现,不同dilation也即是不同视野域分别适应不同尺度的物体,大视野域对大物体友好,小视野域对小物体友好
效果贼好
- (TridentNet:处理目标检测中尺度变化新思路)[https://zhuanlan.zhihu.com/p/54334986]
- (目标检测算法trident network引发的思考)[https://blog.csdn.net/diligent_321/article/details/86531659 ]
以上是关于TridentNet解读的主要内容,如果未能解决你的问题,请参考以下文章