Involution：空间不共享？可完全替代卷积的高性能算子 CVPR 2021

Posted 2023-03-18

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Involution：空间不共享？可完全替代卷积的高性能算子 CVPR 2021相关的知识，希望对你有一定的参考价值。

参考技术A

论文: Involution: Inverting the Inherence of Convolution for Visual Recognition

论文认为卷积操作有三个问题：

为了解决上述的问题，论文提出了与卷积有相反属性的操作involution，核参数在空间上面特异，而在通道上面共享，主要有以下两个优点：

一组involution核可表示为，这里的分组与卷积相反，增加分组是为了增加核的复杂性。对于像素，其involution核为，为involtion核的分组，组内核共享。involution的特征图输出通过对输入特征进行Multiply-Add操作得到：

为通道编号，involution核的大小取决于输入特征图的大小，通过核生成函数动态生成：

为对应的输入像素合集。

为了简洁，论文直接从单个像素生成对应的involution核，更复杂的结构也许能带来更好的性能，但不是当前主要的工作。定义核生成函数 : ，：

和为线性变换，共同构成一个bottleneck结构，为压缩因子，为BN+非线性激活。

公式4和公式6可表示为算法1和图1，在每个位置通过核生成函数生成对应的involution核，再对该位置进行计算得到输出。
在构建完整的网络时，以ResNet作为基础，将stem(开头)的bottleneck中的卷积替换成或的involution，将trunk(后续)的bottleneck中的卷积替换成的involution，卷积保留用作通道融合与扩展。
Involution的优势在于通道信息在核生成时利用了起来，并且后续使用较大的感受野获得更大的空间信息。另外在使用时，前后的卷积也增加了通道交互，从而提升了整体的性能。

下面分别对involution进行两方面的探讨，分别是参数量下降的来源以及性能提升的来源。

Involution的思想十分简洁，从卷积的通道特异、空间共享转换成通道共享、空间特异，我们从参数量和计算量两块来进行分析(不考虑bias和involution的G)：

因为标准卷积实际上会融合多个输入通道进行输出，而且通道不共享，导致参数量和计算量都很高。而分组卷积减少了标准卷积中输出通道与输入通道之间的大量关联，和invlotion在参数量和计算量上有十分相似的地方：

的分组卷积即depthwise卷积，的involution和depthwise卷积两者在结构上也可以认为是完全对立的，一个则通道共享、空间独立，另一个通道独立、空间共享，而在depthwise卷积上加上空间特异的属性即的involution。但在之前很多的研究中，depthwise卷积一般都只用于轻量化网络的搭建，会牺牲部分准确率，而involution却能在减少部分参数量的同时提升准确率。我觉得除了空间特异带来大量参数之外，主要得益于两个部分设计：1）核大小增加到。 2) 根据输入特征动态生成核参数。如果将depthwise卷积按类似的设置替换卷积核，不知道能否达到类似的结果。

self-attention起源于nlp任务，目前在视觉上的应用十分火热，有不错的性能表现。将输入向量线性转化成查询项、关键词项以及值项后，先用计算出相似性，再对值项加权后输出，大致的公式为：

如果将involution的核生成函数看成是的话，则可认为involution在某种意义上等同于self-attention，position encoding的信息也可认为是隐藏在了核生成函数里面，与生成的位置相关。文章花了很多篇幅去说明involution是self-attention的高层定义，有兴趣的可以去看看。不过我们只要理解，involution在特征图的不同位置动态生成了不同的核参数，功能上类似于self-attention中的attention即可，这也是involution能够提升准确率的关键。

从实验结果来看，由involution搭建的ReaNet能够在准确率提升的情况下减少大量的参数，从实际速度来看，GPU速度与ResNet差不多，CPU速度则提升很大。

论文创新地提出了与卷积特性完全相反的基础算子Involution，该算子在通道上共享，而在空间上特异，不仅能够大幅减少参数量，还集成了attention的特性，在速度和准确率上都有很不错的表现。

以上是关于Involution：空间不共享？可完全替代卷积的高性能算子 CVPR 2021的主要内容，如果未能解决你的问题，请参考以下文章

《Involution：Inverting the Inherence of Convolution for Visual Recognition》论文笔记

改进YOLO系列 | CVPR 2021 | Involution：超越convolution和self-attention的神经网络算子

[Paper Weekly]CNN采样方法：空间变换网络(STN)与可变形卷积网络（DCN）

软件分享免费多线程下载神器，可完全替代IDM（支持Mac&Windows）

opencv学习-深度卷积神经网络

第三节：卷积层详解1