『计算机视觉』mini深度学习框架实现

Posted 2021-01-20 hellcat

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了『计算机视觉』mini深度学习框架实现相关的知识，希望对你有一定的参考价值。

一、项目简介

手动实现mini深度学习框架，主要精力不放在运算优化上，仅体会原理。

文件介绍

Layer.py 层 class，已实现：全连接层，卷积层，平均池化层
Loss.py 损失函数 class，已实现：均方误差损失函数
Activate.py 激活函数 class，已实现：sigmoid、tanh、relu
test.py 训练测试代码

主流框架对于卷积相关层的实现都是基于矩阵乘法运算，而非这里的多层for循环，这里仅仅是最直观的演示原理，并非最优实现。

二、测试输出

我们此时不对层函数进行封装，仅仅实现了最简单的前向传播、反向传播、参数获取几个功能，利用这些功能，我们已经可以实现一个最简单的神经网络，

声明并初始化各层class的实例，这会使得各个实例初始化可学习参数

（【注】一般的框架会在运行时，即第一次前向传播时才初始化参数，本demo由于是动态的，所以没必要这样写）

进入循环体：

　　获取数据，向前传播，计算损失函数&损失函数的梯度

　　向后传播，获取各个参数的梯度

　　对参数循环，利用参数梯度更新参数

在test.py中，我们使用tensorflow的接口，下载并读取mnist数据集，然后训练一个10分类的分类器，观察收敛过程。

mnist = input_data.read_data_sets(‘../../Mnist_data/‘, one_hot=True)
X_train,y_train = mnist.train.next_batch(BARCH_SIZE)
X_train = np.reshape(X_train, [4, 1, 28, 28])

conv1 = Layer.Conv2D([8, 1, 2, 2])
pool1 = Layer.MeanPooling([2, 2])
relu1 = Activate.Relu()

conv2 = Layer.Conv2D([16, 8, 2, 2])
pool2 = Layer.MeanPooling([2, 2])
relu2 = Activate.Relu()

conv3 = Layer.Conv2D([8, 16, 2, 2])
pool3 = Layer.MeanPooling([2, 2])
relu3= Activate.Relu()

dense1 = Layer.Dense(128, 10)
sigmoid = Activate.Sigmoid()

loss = Loss.MSECostLayer()

loss_line = []
for i in range(1000):
    # 正向传播
    x = conv1.forward(X_train, 1)
    x = pool1.forward(x, 2)
    x = relu1.forward(x)
    x = conv2.forward(x, 1)
    x = pool2.forward(x, 2)
    x = relu2.forward(x)
    x = conv3.forward(x, 1)
    x = pool3.forward(x, 2)
    x = relu3.forward(x)
    shape = x.shape
    x = x.reshape([x.shape[0], -1])
    x = dense1.forward(x)

    l_val = loss.loss(x, y_train)
    print("损失函数值为：", l_val)
    loss_line.append(l_val)

    # 反向传播
    l = loss.loss_grad(x, y_train)
    l = dense1.backward(l)
    l = l.reshape(shape)
    l = relu3.backward(l)
    l = pool3.backward(l)
    l = conv3.backward(l)
    l = relu2.backward(l)
    l = pool2.backward(l)
    l = conv2.backward(l)
    l = relu1.backward(l)
    l = pool1.backward(l)
    l = conv1.backward(l)

    for layer in [conv1, conv2, conv3, dense1]:
        for param, param_grad in zip(layer.params(), layer.params_grad()):
            param -= LEARNING_RATE * param_grad

实际运行test.py，会输出loss函数结果，并绘制成图，左图展示了整个loss函数收敛过程，

技术分享图片

下图则截掉了前四次迭代输出的Loss，因为初始四次损失函数过大，收敛速度极快，影响后面的结果展示：

技术分享图片

以上是关于『计算机视觉』mini深度学习框架实现的主要内容，如果未能解决你的问题，请参考以下文章

『计算机视觉』mini深度学习框架实现

一、项目简介

相关博客

文件介绍

二、测试输出