对抗子空间维度探讨

Posted 2022-02-15 鬼道2022

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了对抗子空间维度探讨相关的知识，希望对你有一定的参考价值。

引言

对抗样本是深度学习模型的主要威胁之一，对抗样本会使得目标分类器模型分类出错并且它存在于稠密的对抗子空间中，对抗子空间又包含于特定的样本空间中。本文主要是对对抗子空间维数进行探讨，即针对于单个模型的特定样本对抗子空间的维度是多少，针对多个模型的特定样本对抗子空间的维度是多少。

对抗子空间

给定干净样本 $x\\in \\mathbbR^d$ ，以及其对应的标签 $y$ ，带有参数 $\\theta$ 的神经网络分类器为 $f_\\theta(\\cdot)$ ，损失函数为 $J(x,y;\\theta)$ ，对抗样本为 $x^\\prime$ ，则根据多元泰勒展开式可得 $J(x^\\prime,y;\\theta)=J(x,y;\\theta)+(x^\\prime-x)^\\top\\nabla_x J(x,y;\\theta)+O(\\|x^\\prime-x\\|^2)$ 进一步可得优化目标为 $\\beginarrayrl\\mathrmmaximize& J(x,y;\\theta)+(x^\\prime-x)^\\top\\nabla_x J(x,y;\\theta)\\\\\\mathrmsubject \\text to& \\|x^\\prime-x\\|_\\infty \\le \\varepsilon\\endarray$ 进而可得对抗样本的计算公式为 $x^\\prime=x+\\varepsilon \\cdot\\nabla_x J(x,y;\\theta)$ 其中 $\\varepsilon$ 表示的是对抗扰动的大小。由上公式可知，干净样本 $x$ 沿着梯度方向 $\\nabla_x J(x,y;\\theta)$ 可以进入到对抗子空间中。进一步详细的阐述如下图所示，其中图（a）,（b）和（c）表示的是给定一个干净样本沿着不同的方向生成的样本输入到分类器分类的结果示意图，每个方格表示每一个样本的分类结果，方格中白色表示分类器分类正确，彩色表示分类器分类成其它不同的类别。图（d） ,（e）和（f）表示样本移动的方向分解示意图。

由上图（d）可知，如果选择两个正交方向，一个是对抗扰动的梯度方向，另一个是随机扰动方向，从图（a）可知，沿着对抗扰动方向的干净样本可以进入到对抗子空间中，沿着随机扰动的方向则没有生成对抗样本。由上图（e）可知，如果这两个正交方向与梯度方向成一个角度，则从图（b）可知这两个正交方向都可以进入到对抗子空间中，但是却不是最速方向。由上图（f）可知，如果这两个正交方向是都是随机扰动，从图（c）可知，干净样本都很难进入到对抗子空间中去，该图出现误分类的情况与对抗样本无关，跟模型自身的训练情况有关。

单模型对抗子空间维数

由上一节对对抗样本损失函数的多元泰勒展开可以近似有 $J(x^\\prime,y;\\theta)\\approx J(x,y';\\theta)+(x^\\prime-x)^\\top \\nabla_x J(x,y;\\theta)$ 其中令 $\\nabla_x J(x,y;\\theta)\\in \\mathbbR^d$ ， $(x^\\prime-x)\\in \\mathbbR^d$ 。目的是要探究给定一个模型，求解对抗扰动 $r$ 使得模型损失函数至少增长 $\\alpha$ 得对抗子空间维度的问题，数学表述为 $\\beginalignedJ(x^\\prime,y;\\theta)-J(x,y;\\theta)&=r^\\top g\\ge \\alpha\\\\\\endaligned$ 其中 $\\in \\mathrmSpan\\r_1,r_2\\cdots,r_k\\$ ，即扰动 $r$ 属于 $r_1,r_2,\\cdots,r_k$ 这 $k$ 个正交向量组成的对抗子空间中， $k$ 就是对抗子空间的维度。此时有如下定理成立，详细证明过程如下所示：

定理：给定 $\\in \\mathbbR^d$ 和 $\\alpha \\in[0,1]$ ，最大对抗子空间维数 $k$ 的正交向量 $r_1,r_2,\\ldots,r_k$ 满足 $\\left\\|r_i\\right\\|_2 \\leq 1$