产品经理看AIGC--GAN(生成对抗网络)白话原理

Posted 梦想周知

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了产品经理看AIGC--GAN(生成对抗网络)白话原理相关的知识,希望对你有一定的参考价值。

《AIGC:智能创作时代》的阅读随笔(推荐单独阅读第二章,其余章节快速略过),期待从业务角度而非推导角度更好的理解,为产品从业人员提供更好的了解沟通渠道。

如何理解对抗 

如何从白话角度理解生成对抗网络,核心在于如何理解“对抗”,通俗的字面理解“对抗”,我们会联想到对立事件的博弈,例如NBA的训练场上,球星想要练习投篮的稳定性,此时会有一名训练师来进行针对性的防守,从而发现并提升球星的短板,例如投篮的球速太慢,投篮的高度不够等等。

在GAN算法的角度上,对抗源于生成器和判别器。

通过一个生成器和一个判别器的相互对抗,来实现图像或文字等元素的生成过程。(原始的GAN并不要求生成器和判别器都是一个深度神经网络,但是在实践中通常都采用深度神经网络去构建GAN)

生成器

我们可以向生成器(Generator)输入包含一串随机数的向量,生成器会根据这一串随机数生成并输出图像或句子。向量里的每一个数字都会与生成的图像或句子的特征相关联。

打一个并不严谨的比方,假设生成器收到的输入是[0.1,-0.5,0.2 …0.9],据此生成了一张小猫的图片,而第一个数是和小猫的颜色相关的,当你把0.1换成0.2时,小猫可能就从橘猫变成了白猫。

因为随机数是可以随意构造的,因此我们就可以利用生成器生成各种各样的新图片。不过,和一般的神经网络一样,在生成之前会有提前训练的过程,我们需要准备一个全是各种各样小猫图片的数据集供生成器训练。

判别器

判别器(Discriminator)用于评价生成器生成的图像或句子到底看起来有多么真实。判别是否真实的方式也很简单,就是看这个图像或句子像不像来自生成器训练用的数据集,因为数据集是最真实的。

我们可以向判别器输入一个生成的图像或句子,判别器会输出一个数值(也被称为得分)。一般来说,我们会使用0到1的区间来表示得分,如果这个图像或句子非常像数据集里的真实数据,得分就会靠近1;反之,得分就会靠近0。

生成对抗过程

以图像生成的过程为例,生成器就好像一个学习画画的学生,而判别器就是评价学生画作的老师。一开始,学生读一年级,他看了一堆小猫的图片,然后随便画了一只猫,老师看了看学生画的猫,说画得不够逼真,看不清小猫的两只眼睛,这就是最开始的生成器和判别器的交互过程。

学生努力练习画画,终于画好了小猫的两只眼睛,老师一看说合格了,然后学生升到了二年级,老师也开始依照二年级的评价标准去评价学生的画作,相当于生成器和判别器的性能都提升了。

升到二年级后,学生再拿出原来的小猫画作肯定就无法令老师满意了,老师会觉得画得不够真实,无法看清小猫的脸部轮廓,于是学生又反复练习修改,直到令老师满意,于是学生升到三年级。

如此循环往复,学生画画的水平会越来越精湛,画作看起来越来越真实。

而老师判别画作的标准也会越来越严苛,督促学生完善画技,这就是生成器和判别器对抗过程的基本思想,而就具体的实现过程来说,可以把GAN的训练过程分为两个步骤。

生成对抗过程示意图

步骤一:固定生成器,更新判别器

首先,生成器抽取一些包含一系列随机数的向量,输入生成器之中,生成器会生成一系列图片。这时,在生成器内部参数不变的情况下,判别器需要从生成器训练的数据集中抽取一部分图片,将它们和生成器生成的图片一起做学习训练。

判别器需要调整内部参数,学习给真实的图片打高分,给生成器生成的假图片打低分。就好比如果想要让老师指导学生,首先需要对老师进行教学技能培训,让老师先学会评价标准,才能去教育和考查学生。

步骤二:固定判别器,更新生成器

判别器训练好之后,保持内部参数不变,生成器需要调整内部参数进行训练,以学会如何在判别器那里取得高分。这个过程就像学生反复考试一样,在每次复盘自己的失误进行改进后,终有一天会达到老师的标准。

应用

虽然GAN的一些变体也可以用于句子这种文本类信息的生成,但因为对于离散型数据的处理能力较差(为什么处理离散型数据的处理能力较差,对于产品同学而言,我觉得了解一款算法的优势和劣势即可,对于推导的原理不用过多的关注)AIGC应用最广泛的场景还是在图像之中,或是与图像相关的跨模态生成中。

一些可能存在的商机,C端场景下,例如实现二次元人物生成现实照片,按照次数解锁付费,或者以次作为内容生产二次创作。在更B的场景下,针对性的提高企业某个生产环节的生产效率,但是如何提升其壁垒,仍然是重中之重。


写在最后:为什么产品经理要关注算法?

产品的决策最终是要回归到理性的策略上的,而算法是最贴近策略的,产品需要做的是了解算法的应用场景和优势劣势,在特定的场景下进行组合,最终对产品的用户体验和商业化负责。

以上是关于产品经理看AIGC--GAN(生成对抗网络)白话原理的主要内容,如果未能解决你的问题,请参考以下文章

一文看懂「生成对抗网络 - GAN」基本原理+10种典型算法+13种应用

生成式对抗网络GAN(一)

11.深度神经网络及其应用: 卷积神经网络, 胶囊网络, 生成对抗网络

使用生成对抗网络(GAN)生成手写字

综述 | 生成式对抗网络异常检测

硅谷科技产品经理眼里的NFT效用和未来前景