《SARAS-Net: Scale and Relation Aware Siamese Network for Change Detection》论文分享

Posted 2023-03-04 怀铭

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了《SARAS-Net: Scale and Relation Aware Siamese Network for Change Detection》论文分享相关的知识，希望对你有一定的参考价值。

Overview

一般融合后提取和提取后融合方法仅以相同的比例逐层计算特征的注意力。将产生许多对小变化区域的预测失误和对大的无关变化的错误警报，作者提出了两种关键方法缓解上述尺度问题：

计算增强特征的注意力不仅在图像对的减法（差分图）之前，而且在图像对的减法之后

从深层特征中逐层计算关注度，不仅在相同的尺度上，而且在交叉尺度上，以很好地检测变化区域，即使大小不同。

进而提出了三个模块：关系感知（relation-aware）, 尺度感知（scale-aware）和交叉变换器（cross-transformer）

从下图可以看出，差分图操作之前是关系感知模块；差分图操作之后是尺度感知模块和交叉变换器模块。

Relation-aware module

这一模块主要是为了学习到双时相之间的相互关系。使用的是Transformer中的QKV注意力机制来对Backbone中提取到的特征金字塔的每一层计算双时相遥感图像之间的相关性：

对每一个特征金字塔层进行计算相关性时，主要使用了两次注意力机制：cross-attention module和cross-self-attention module。

两者的结构相同，但输入的不同：

cross-attention module输入都为Backbone第n层输出的原始特征图 $\text{[math]}$ 和 $\text{[math]}$

cross-self-attention module输入的 $\text{[math]}$ 和 $\text{[math]}$ 经过cross-attention module的输出和原始的 $\text{[math]}$ 或 $\text{[math]}$ （具体是 $\text{[math]}$ 还是 $\text{[math]}$ ，和cross-attention module一致）

具体结构如下图：

Scale-aware module

这一模块的主要目的是为下一模块（Cross transformer module）提供不同尺度的输入，同时也能够进行初步的不同尺度特征的信息交融。

这一操作会对特征金字塔的每一差分后的特征层（后也称其为特征层）都进行一次，具体是将其余特征层的特征图resize至当前特征图的大小（通过线性插值上采样和1×1卷积），并与当前层的特征图经过global average pooling、1×1卷积和Sigmoid激活函数所得的通道注意力权重相乘。通过这一方法强调各层特征图中在当前特征图中更加关注的通道，并将转化后的所有特征图作为Cross transformer module的输入让其融合不同尺度特征图的信息。

Cross transformer module

这一模块的主要作用是以当前层为主融合上一模块输入的各尺度特征图之间的信息。

利用的也是QKV注意力机制，给定当前特征图 $\text{[math]}$ ，我们训练三个矩阵 $\text{[math]}$ 、 $\text{[math]}$ 、 $\text{[math]}$ ，将其分别映射到查询 $\text{[math]}$ 、关键字 $\text{[math]}$ 和值 $\text{[math]}$ 。类似地，给定 $\text{[math]}$ 、 $\text{[math]}$ 和 $\text{[math]}$ ，我们可以训练线性矩阵分别获得 $\text{[math]}$ 、 $\text{[math]}$ 、 $\text{[math]}$ 、 $\text{[math]}$ 、 $\text{[math]}$ 、 $\text{[math]}$ 。然后，基于 $\text{[math]}$ ，我们可以在m=a，b，c，d的情况下训练它与所有关键字 $\text{[math]}$ 之间的交叉尺度关注度 $\text{[math]}$ ：