TridentNet解读

Posted 2022-05-31 爆米花好美啊

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了TridentNet解读相关的知识，希望对你有一定的参考价值。

检测领域一直存在一个scale variation问题，大小物体对视野域的需要是不一样的，deformable cnn的作者daijifeng老师就提到一个说法：最好的视野域就是刚好“覆盖自己”，不要太大也不要太小。前人有3种途径

利用RCNN去原图上扣proposal，强制使得所有物体的视野域就是自己 Revisiting RCNN: On Awakening the Classification Power of Faster RCNN
Deformable cnn，可变型卷积不同物体学习不同的视野域论文中也有可视化的图 Deformable ConvNets v2
Image Pyramid SNIP系列分三路RPN学习不同尺度的物体SNIP
Feature Pyramid FPN系列能部分解决尺度问题，为了兼容大小物体，导致大小物体特征的“表达能力”都不是最强

而本文TridentNet也算是分3路学习不同尺度的物体，不过不是将网络直接分成三路，因为SNIP这样的测试时间太慢了
为了使模型对不同尺寸目标的“表达能力”近似，作者借鉴了SNIP的特征提取网络，采用了“scale-aware”的并行结构；
为了加快模型的推理速度，作者采用了dilated convolution得到不同感受野的特征图，从而实现检测不同尺度目标的目的，取代了SNIP中的特征金字塔生成不同尺度目标的做法

从下图发现，不同dilation也即是不同视野域分别适应不同尺度的物体，大视野域对大物体友好，小视野域对小物体友好

效果贼好

(TridentNet：处理目标检测中尺度变化新思路)[https://zhuanlan.zhihu.com/p/54334986]
(目标检测算法trident network引发的思考)[https://blog.csdn.net/diligent_321/article/details/86531659 ]

以上是关于TridentNet解读的主要内容，如果未能解决你的问题，请参考以下文章