风格转换简介
Posted Young_Gy
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了风格转换简介相关的知识,希望对你有一定的参考价值。
风格转换,是把一张图片转化成同内容但包含某风格的新图片。本文将介绍如何让机器学习风格转换,包含两种方法:优化问题求解、转化网络求解。
风格转换
风格转换,就是根据现有的风格照片
S
,把当前照片
本文将叙述两种风格转换的思路:
- 将风格转换变成优化问题的求解,构建
T,C 之间的损失 Lc 以及 T,S 之间的损失 Ls ,同时增加图片平滑的损失 Lv 。通过求解 minT∑iLi 的优化问题求解。- 不直接把目标图片
T
当做求解变量,而是构建一个
transform network
把内容图片C 转化成目标图片 T ,以类似1中的方法构建损失函数,通过求解transform network
的参数求解该问题。
- 不直接把目标图片
T
当做求解变量,而是构建一个
优化问题
综述
首先,陈述问题:假设已知风格照片
下面,确定几个损失函数:
-
Ls
:
T
和
S 风格上的距离 -
Lc
:
T
和
C 内容上的距离 - Lv : T 不平滑的度量
最后,便是求解优化问题:
损失函数
优化问题中 Ls,Lc 是通过预先训练的VGG网络得到。
首先,简单介绍下VGG网络:它是一种固定的网络结构,其结构如下所示,一般采用D或E结构,通常叫VGG-16和VGG-19:
那么,为什么 Ls,Lc 是通过预先训练的VGG网络得到呢?
训练后的VGG网络,每一层都对特征进行了抽象,越深得到的特征越具象。所以每一层的特征也就代表了图片不同粒度的抽象,可以根据特征的距离判断图片内容的相似程度。VGG的卷积层得到了feature map
,假设其大小是
C∗H∗W
。
假设在层
l
,feature map
是
Tl
,
C
的feature map
是
Lc(Tl,Cl)=||Tl−Cl||
假设在层
l
,