Ensembling Off-the-shelf Models for GAN Training（GAN模型迎来预训练时代，仅需1%的训练样本）

Posted 2022-10-03 马鹏森

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Ensembling Off-the-shelf Models for GAN Training（GAN模型迎来预训练时代，仅需1%的训练样本）相关的知识，希望对你有一定的参考价值。

Ensembling Off-the-shelf Models for GAN Training

（集成现成的GAN训练模型）

论文链接：https://arxiv.org/abs/2112.09130

项目链接：https://github.com/nupurkmr9/vision-aided-gan

视频链接：https://www.youtube.com/watch?v=oHdyJNdQ9E4

解决了什么问题？

每次GAN模型都要从头训练的日子过去了！最近CMU联手Adobe提出了一种新的模型集成策略，让GAN模型也能用上预训练，成功解决「判别器过拟合（训练集性能很强，但在验证集上表现得很差）」这个老大难问题。

图像生成本身就需要能够捕捉和模拟真实世界视觉现象中的复杂统计数据，不然生成出来的图片不符合物理世界规律，直接一眼鉴定为「假」。

预训练模型提供知识、GAN模型提供生成能力，二者强强联合，多是一件美事！

问题来了，哪些预训练模型、以及如何结合起来才能改善GAN模型的生成能力？

最近来自CMU和Adobe的研究人员在CVPR 2022发表了一篇文章，通过「选拔」的方式将预训练模型与GAN模型的训练相结合。

GAN模型的训练过程由一个判别器和一个生成器组成，其中判别器用来学习区分真实样本和生成样本的相关统计数据，而生成器的目标则是让生成的图像与真实分布尽可能相同。

理想情况下，判别器应当能够测量生成图像和真实图像之间的分布差距。

但在数据量十分有限的情况下，直接上大规模预训练模型作为判别器，非常容易导致生成器被「无情碾压」，然后就「过拟合」了。

通过在FFHQ 1k数据集上的实验来看，即使采用最新的可微分数据增强方法，判别器仍然会过拟合，训练集性能很强，但在验证集上表现得很差。

Training and validation accuracy w.r.t. training iterations for our DINO [11] based discriminator vs. baseline StyleGAN2-ADA discriminator on FFHQ 1k dataset.

Figure 3. Our discriminator based on pretrained features has higher accuracy on validation real images and thus shows better generalization. In the above training, vision aided adversarial loss is added at the 2M iteration.

此外，判别器可能会关注那些人类无法辨别但对机器来说很明显的伪装。

为了平衡判别器和生成器的能力，研究人员提出将一组不同的预训练模型的表征集合起来作为判别器。

Figure 1. The model bank F consists of widely used and state-of-the-art pretrained networks. We automatically select a subset from F, which can best distinguish between real and fake distribution.
Our training procedure consists of creating an ensemble of the original discriminator D and discriminators based on the feature space of selected off-the-shelf models.
is a shallow trainable network over the frozen pretrained features.