利用对抗变化网络进行对抗训练

Posted 2022-02-09 鬼道2022

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了利用对抗变化网络进行对抗训练相关的知识，希望对你有一定的参考价值。

1 引言

前一段时间解读了一篇发表于CVPR2021的一篇文章《Improving the Transferability of Adversarial Samples with AdversarialTransformations》，解读文章的链接为《CVPR2021：对抗变换提高对抗样本的可迁移性》。该论文的创新点是首先对抗训练出一个对抗变换网络，该对抗变换网络的核心作用是用来抑制对抗样本攻击性，然后借助对抗变换网络生成对抗样本，最终生成的对抗样本在攻击性和可迁移性的方面能力得到了显著的提高。由此启发一个想法油然而生，如果利用论文中方法生成对抗样本对分类器模型进行对抗训练，那么是不是会使分类器模型的更加鲁棒呢？带着这个问题展开本文章的理论分析和实验验证。

2 方法描述

令 $x\\in\\mathbbR^n\\times 1$ 表示干净的数据样本，其对应的真实标签为 $y\\in\\1,\\cdots,k\\$ ；带有参数 $\\theta$ 的分类器网络为 $f_\\theta(x)$ ，其映射为 $f_\\theta:\\mathbbR^n\\times1\\rightarrow\\mathbbR^k\\times1$ ；带有参数 $\\varphi$ 的对抗变换网络 $g_\\varphi(x)$ ，其映射为 $g_\\varphi:\\mathbbR^n\\times 1\\rightarrow \\mathbbR^n\\times 1$ ；损失函数为 $J(\\cdot,\\cdot)$ 。生成对抗样本 $x^\\prime\\in \\mathbbR^\\ n\\times 1$ 一般的优化形式为 $\\beginarrayrl\\max\\limits_x^\\prime& J(f_\\theta(x^\\prime),y)\\\\\\mathrms.t. & \\|x^\\prime-x\\|_\\infty\\le \\varepsilon\\endarray$ 其中 $\\|\\cdot\\|_\\infty$ 表示的是无穷范数， $\\varepsilon$ 表示的是对抗样本 $x^\\prime$ 和干净样本 $x$ 之间的最大扰动距离。
当前常用样本数据变换的方式比较固定，比如翻转，缩放，颜色变换等。对抗变换网络的主要目的增强样本变换多样性，从而抑制对抗扰动的攻击性。在生成对抗样本的时候，则需要克服对抗变换网络削弱对抗攻击性的条件下，依然能够使得分类器模型分类出错。对抗变换网络训练与对抗样本生成的对抗目标可以用如下 $\\min$ - $\\max$ 公式给出 $\\beginarrayrl\\min\\limits_\\varphi\\max\\limits_x^\\prime&J(f_\\theta(g_\\varphi(x^\\prime)),y)\\\\\\mathrms.t.&\\left\\\\beginaligned\\|&x^\\prime-x\\|_\\infty\\le\\varepsilon\\\\&\\arg\\max f_\\theta(g_\\varphi(x))=y\\endaligned\\right.\\endarray$ 其中对抗变换网络 $g_\\varphi(\\cdot)$ 可以是 $\\mathrmCNN$ 网络，也可以是 $\\mathrmVision \\text Transformer$ ，在以下的实验方法中会着重对这两种网络架构进行探讨。
借助对抗网络 $g_\\varphi(\\cdot)$ 生成的对抗样本 $x^\\prime$ 对分类器模型 $f_\\theta$ 进行对抗训练。此时对抗训练的目标可以由双 $\\min$ - $\\max$ 进行描述 $\\beginarrayrl\\min\\limits_\\theta\\max\\limits_x^\\prime\\min\\limits_\\varphi\\max\\limits_x^\\prime&J(f_\\theta(g_\\varphi(x^\\prime)),y)\\\\\\mathrms.t.&\\left\\\\beginaligned\\|&x^\\prime-x\\|_\\infty\\le\\varepsilon\\\\&\\arg\\max f_\\theta(g_\\varphi(x))=y\\endaligned\\right.\\endarray$