多层自编码器的微调

Posted tina_ttl

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了多层自编码器的微调相关的知识,希望对你有一定的参考价值。

多层自编码器由多个稀疏自编码器和一个Softmax分类器构成;(其中,每个稀疏自编码器的权值可以利用无标签训练样本得到, Softmax分类器参数可由有标签训练样本得到)多层自编码器微调是指将多层自编码器看做是一个多层的神经网络,利用有标签的训练样本集,对该神经网络的权值进行调整。

1多层自编码器的结构

多层自编码器的结构如图1所示,它包含一个具有2个隐藏层的栈式自编码器和1个softmax模型;栈式自编码器的最后一个隐藏层的输出作为softmax模型的输入,softmax模型的输出作为整个网络的输出(输出的是条件概率向量)。

技术分享

图1 多层自编码器的结构

微调多层自编码器的流程图如图2所示,该流程主要包括三部分:

(1)初始化待优化参数向量

(2)调用最优化函数,计算最优化参数向量

(3)得到最优化参数向量,可以转换为网络各结构所对应的参数

其中,最小化代价函数主要利用minFunc函数,该优化函数格式如下:

技术分享

可知,为了实现优化过程,最为关键问题就是编写stackedAECost函数

技术分享

图2 多层自编码器的微调流程

2整个网络参数的初始化

整个网络的参数stackedAETheta(列向量形式)由两部分组成:softmax分类器参数向量+稀疏自编码器参数向量;他们的初始化值由稀疏自编码和softmax学习获得:

技术分享

技术分享

3 stackedAECost函数

3.1稀疏自编码器部分的激励值

3.1.1 稀疏自编码器部分的结构图

多层网络的稀疏自编码器部分如下图所示

技术分享

图3 多层网络的稀疏自编码器部分

3.1.2 稀疏自编码器部分各层激励值(输出)

单个样本

多个样本

技术分享

技术分享

3.1.3 softmax分类器的激励值(输出)

单个样本

多个样本

技术分享

技术分享

3.1.4 程序

技术分享

3.2代价函数

3.2.1代价函数的计算公式

该多层网络的代价函数完全按照softmax模型的代价函数计算,并加入正则项,但要注意,这里加入的正则项必须要对整个网络的所有参数进行惩罚!

技术分享

3.2.2程序如下

技术分享

3.3梯度计算

3.3.1 softmax模型

该模型的梯度计算与单独使用softmxa模型的公式是相同的,即:

技术分享

只不过这里的x为softmax自编码器最后一层的输出h(2)

技术分享

3.1.2 stack自编码器各层

技术分享

单个样本

多个样本

技术分享

技术分享

3.3.3 整个网络的梯度

最后,将整个网络的梯度(softmaxThetaGrad和stackgrad)存放在一个列向量中

技术分享

以上是关于多层自编码器的微调的主要内容,如果未能解决你的问题,请参考以下文章

tensorflow学习笔记:实现自编码器

深度学习笔记 栈式自编码器

Keras深度学习实战(16)——自编码器详解

神经网络学习之栈式自编码器

如何使用注意力机制在多层双向中操纵编码器状态

Transformer(需修改)