Conditional GAN

Posted 2022-11-28 zhiyong_will

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Conditional GAN相关的知识，希望对你有一定的参考价值。

1. 概述

GAN的出现为数据生成提供了一种新的思路，以图像生成为例，在GAN框架中，不再需要其他复杂的操作，如Markov Chain等，只需要对定义好的网络进行backpropagation即可完成生成网络的训练。在原始的GAN框架中，包括了两个部分，分别为生成网络（Generator） $G$ 和判别网络（Discriminator） $D$ ，其中生成网络（Generator） $G$ 用于生成图片，判别网络（Discriminator） $D$ 用于判别一张图片是否是真实的。通过不断提高生成网络 $G$ 的生成质量，最终“骗”过判别网络 $D$ ，在此过程中，判别网络 $D$ 也在不断提高自身的判别能力，通过如此的一个动态的“博弈”过程，最终，训练好的生成网络 $G$ 便可以用于生成“以假乱真”的图片。

然而在所有的过程中，无论是生成过程还是判别过程都是无任何指导的，Conditional GAN[1]提出在上述的两个过程中引入一个条件，以此指导上述的两个过程。

2. 算法原理

2.1. GAN原理回顾

在原始的GAN框架中，包括了两个部分，分别为生成网络（Generator） $G$ 和判别网络（Discriminator） $D$ ，其中：

生成网络（Generator） $G$ 用于生成图片，其输入是一个随机的噪声 $\\boldsymbolz$ ，通过这个噪声生成图片，记作 $G\\left ( \\boldsymbolz \\right )$
判别网络（Discriminator） $D$ 用于判别一张图片是否是真实的，对应的，其输入是一整图片 $\\boldsymbolx$ ，输出 $D\\left ( \\boldsymbolx \\right )$ 表示的是图片 $\\boldsymbolx$ 为真实图片的概率

在GAN框架的训练过程中，希望生成网络 $G$ 生成的图片尽量真实，能够欺骗过判别网络 $D$ ；而对于判别网络 $D$ ，希望能够把 $G$ 生成的图片从真实图片中区分开。这样的一个过程就构成了一个动态的“博弈”。最终，GAN希望能够使得训练好的生成网络 $G$ 生成的图片能够以假乱真，即对于判别网络 $D$ 来说，无法判断 $G$ 生成的网络是不是真实的。此时，训练好的生成网络 $G$ 便可以用于生成“以假乱真”的图片。

GAN的价值函数：

$\\undersetGmin\\; \\undersetDmax\\; V\\left ( D,G \\right )=\\mathbbE_\\boldsymbolx\\sim p_data\\left ( \\boldsymbolx \\right )\\left [ log\\; D\\left ( \\boldsymbolx \\right ) \\right ]+\\mathbbE_\\boldsymbolz\\sim p_\\boldsymbolz\\left ( \\boldsymbolz \\right )\\left [ log\\; \\left ( 1-D\\left ( G\\left ( \\boldsymbolz \\right ) \\right ) \\right ) \\right ]$

GAN的训练过程如下所示：

2.2. Conditional GAN

Conditional GAN的思想也比较简单，在GAN的基础上增加了条件输入，在生成网络和判别网络中分别加入一个条件输入 $\\boldsymboly$ ， $\\boldsymboly$ 可以为任何的额外信息，分别与原始的 $\\boldsymbolx$ 和 $\\boldsymbolz$ 这两个输入concat在一起，如下图所示：

Conditional GAN的价值函数：

$\\undersetGmin\\; \\undersetDmax\\; V\\left ( D,G \\right )=\\mathbbE_\\boldsymbolx\\sim p_data\\left ( \\boldsymbolx \\right )\\left [ log\\; D\\left ( \\boldsymbolx\\mid \\boldsymboly \\right ) \\right ]+\\mathbbE_\\boldsymbolz\\sim p_\\boldsymbolz\\left ( \\boldsymbolz \\right )\\left [ log\\; \\left ( 1-D\\left ( G\\left ( \\boldsymbolz\\mid \\boldsymboly \\right ) \\right ) \\right ) \\right ]$

假设从真实数据中采样 $m$ 个样本 $\\left \\ \\boldsymbolx^\\left ( 1 \\right ),\\boldsymbolx^\\left ( 2 \\right ),\\cdots ,\\boldsymbolx^\\left ( m \\right ) \\right \\$ ，从噪音分布 $p_g\\left ( \\boldsymbolz \\right )$ 中同样采样 $m$ 个样本，记为 $\\left \\ \\boldsymbolz^\\left ( 1 \\right ),\\boldsymbolz^\\left ( 2 \\right ),\\cdots ,\\boldsymbolz^\\left ( m \\right ) \\right \\$ ，针对每一个样本，都有一个对应的条件，记为 $\\left \\ \\boldsymboly^\\left ( 1 \\right ),\\boldsymboly^\\left ( 2 \\right ),\\cdots ,\\boldsymboly^\\left ( m \\right ) \\right \\$ ，此时，上述价值函数可以近似表示为：

$\\undersetGmin\\; \\undersetDmax\\; V\\left ( D,G \\right )\\approx \\sum_i=1^m\\left [ log\\; D\\left ( \\boldsymbolx^\\left ( i \\right )\\mid \\boldsymboly^\\left ( i \\right ) \\right ) \\right ]+\\sum_i=1^m\\left [ log\\; \\left ( 1-D\\left ( G\\left ( \\boldsymbolz^\\left ( i \\right )\\mid \\boldsymboly^\\left ( i \\right ) \\right ) \\right ) \\right ) \\right ]$