VAE与CVAE

Posted 2022-11-29 Paul-Huang

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了VAE与CVAE相关的知识，希望对你有一定的参考价值。

CVAE理论到代码

1. VAE的本质
- 1.1 深度理解VAE
- 1.2 VAE 与GAN
2. CVAE
参考

1. VAE的本质

1.1 深度理解VAE

VAE本质就是在我们常规的自编码器的基础上，对encoder的结果（在VAE中对应着计算均值的网络）加上了 $\\colorred“高斯噪声”$ ， $\\colorred使得结果decoder能够对噪声有鲁棒性$ ；而那个额外的KL loss（目的是让均值为0，方差为1），事实上就是相当于对encoder的一个正则项，希望encoder出来的东西均有零均值。
VAE 中的encoder（对应着计算方差的网络）的作用：是用来 $\\colorred动态调节噪声的强度$ 的。
- 当decoder还没有训练好时（ $\\colorblue重构误差$ 远大于KL loss），就会适当 $\\colorblue降低噪声$ （KL loss增加），使得拟合起来容易一些（重构误差开始下降）；
- 如果decoder训练得还不错时（ $\\colorblue重构误差$ 小于KL loss），这时 $\\colorblue噪声就会增加$ （KL loss减少），使得拟合更加困难了（重构误差又开始增加），这时候decoder就要想办法提高它的生成能力了。
具体理解参照：下图，以及以下公式
1. 观测数据集 $X=\\left\\ \\mathttx^(i) \\right\\^N_i=1 i.i.d$ （ $X$ 本身可能是连续分布或者离散分布），对某个 $x$ 的概率处理：
  $\\beginaligned\\log\\; p_\\theta(\\mathttx^(i) )&=\\log\\; p_\\theta (\\mathttx^(i),\\mathttz)- \\log\\; p_\\theta (\\mathttz|\\mathttx^(i))\\\\ &=\\log\\; \\fracp_\\theta (\\mathttx^(i),\\mathttz)q_\\phi(\\mathttz|\\mathttx^(i))-\\log\\; \\fracp_\\theta (\\mathttz|\\mathttx^(i))q_\\phi(\\mathttz|\\mathttx^(i))\\; \\; (q_\\phi(\\mathttz|\\mathttx^(i))\\neq 0).\\endaligned\\tag1.1$
  (2.2.2)式两边对 $q_\\phi(\\mathttz|\\mathttx^(i))$ 求期望得：
  $\\log p_\\theta(\\mathttx^(i))=D_KL(q_\\phi(\\mathttz|\\mathttx^(i))||p_\\theta (\\mathttz|\\mathttx^(i)))+\\mathcalL(\\theta,\\phi;\\mathttx^(i))\\tag1.2$
  其中：
  $\\colorblue\\ \\beginaligned \\mathcalL(\\theta,\\phi;\\mathttx^(i))&=\\int_z q_\\phi(\\mathttz|\\mathttx^(i)) \\log\\ \\fracp_\\theta (\\mathttz,\\mathttx^(i))q_\\phi(\\mathttz|\\mathttx^(i))dz\\\\ D_KL(q_\\phi(\\mathttz|\\mathttx^(i))||p_\\theta (\\mathttz|\\mathttx^(i)))&= - \\int_z q_\\phi(\\mathttz|\\mathttx^(i))\\log\\ \\fracp_\\theta (\\mathttz|\\mathttx^(i))q_\\phi(\\mathttz|\\mathttx^(i))dz \\endaligned$