如何对神经网络模型训练结果进行评价

Posted 阿旭算法与机器学习

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何对神经网络模型训练结果进行评价相关的知识,希望对你有一定的参考价值。

关注上方“阿旭算法与机器学习”,文末有福利哦!

You cannot count on anyone except yourself.

凡事靠自己,不能指望别人。



上一篇文章《》介绍了基于mnist的手写体数字集的两层神经网络的搭建与训练过程,通过损失函数的训练结果我们可以发现,随着训练的进行,损失函数逐渐减小,但是光这一点并不能很好的说明该神经网络的训练结果能够很好的对于其他数据也能够达到同样的精确度。这就涉及到神经网络的泛化能力问题。神经网络学习的最初目标是掌握泛化能力,因此,要评价神经网络的泛化能力,就必须使用不包含在训练数据中的数据。

过拟合


神经网络的学习中,必须确认是否能够正确识别训练数据以外的其他数据,即确认是否会发生过拟合。过拟合是指,虽然训练数据中的能够达到很好的识别精度,但是对于测试数据的识别精度却效果很差。

神经网络结果的评价

基于上一篇文章自己搭建的神经网络,本文我们对于不同的epoch次数下的训练数据和测试数据的识别精度进行输出,对两个识别精度进行比较,看该神经网络训练的结果是否也能够很好的识别测试数据。

注:epoch表示学习中所有的训练数据均被使用过一次的更新次数。

训练集与测试集精度的比较,实现代码如下:(神经网络的搭建代码见上一篇文章)

  
    
    
  
1import sys, os
2import numpy as np
3import matplotlib.pyplot as plt
4from dataset.mnist import load_mnist
5from two_layer_net import TwoLayerNet #导入自己搭建的两层神经网络
6
7# 读入数据
8(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, one_hot_label=True)
9
10network = TwoLayerNet(input_size=784, hidden_size=50, output_size=10)
11
12iters_num = 10000  # 设定循环的次数10000
13train_size = x_train.shape[0]
14batch_size = 100
15learning_rate = 0.1
16
17train_acc_list = []  #记录训练集的识别精度
18test_acc_list = []   #记录测试集的识别精度
19
20iter_per_epoch = max(train_size / batch_size, 1)
21
22for i in range(iters_num):
23    batch_mask = np.random.choice(train_size, batch_size)
24    x_batch = x_train[batch_mask]
25    t_batch = t_train[batch_mask]
26
27    # 计算梯度
28    #grad = network.numerical_gradient(x_batch, t_batch)
29    grad = network.gradient(x_batch, t_batch)
30
31    # 更新参数
32    for key in ('W1''b1''W2''b2'):
33        network.params[key] -= learning_rate * grad[key]
34
35    loss = network.loss(x_batch, t_batch)
36
37    if i % iter_per_epoch == 0:
38        # 每一个epoch记录一次训练集与测试集的识别精度
39        train_acc = network.accuracy(x_train, t_train)
40        test_acc = network.accuracy(x_test, t_test)
41        train_acc_list.append(train_acc)
42        test_acc_list.append(test_acc)
43        print("train acc, test acc | " + str(train_acc) + ", " + str(test_acc))
44
45# 绘制训练集与测试集识别精度比较的图形
46markers = {'train''o''test''s'}
47x = np.arange(len(train_acc_list))
48plt.plot(x, train_acc_list, label='train acc')
49plt.plot(x, test_acc_list, label='test acc', linestyle='--')
50plt.xlabel("epochs")
51plt.ylabel("accuracy")
52plt.ylim(01.0)
53plt.legend(loc='lower right')
54plt.show()

训练集与测试集的识别精度对比结果如下:


图中,实线表示训练数据的识别精度,虚线表示测试数据的识别精度

如图所示,随着epoch的前进(神经网络训练的进行),我们发现使用训练数据和 测试数据评价的识别精度都提高了,并且,这两个识别精度基本上没有差异(两 条线基本重叠在一起)。因此,可以说这次的神经网络的训练过程中没有发生过拟合的现象,该神经网络是可以正常使用的。

总结

上便是本文的主要内容,通过比较训练集与测试集在不同训练轮次epoch下的识别精度,验证了该神经网络训练的准确性。

至此,前面几篇文章完成了神经网络基础知识以及训练过程等内容讲解:包括神经网络的起源、损失函数、激活函数、梯度计算、手动搭建神经网络的训练过程以及对于神经网络好坏评价的判断方式等,后续会对神经网络其他的相关知识进行进一步的介绍。欢迎持续关注~~

end





如何对神经网络模型训练结果进行评价
精彩推荐




    长按二维码扫描关注

阿旭算法与机器学习



看到这里,如果你喜欢这篇文章的话,

点击下方【在看】或【转发】,就是对我最大的支持,谢谢!

以上是关于如何对神经网络模型训练结果进行评价的主要内容,如果未能解决你的问题,请参考以下文章

PyTorch-应该如何规范各个实例

性能评价

使用SVM模型对京东评价进行情感分析---大白话版

tensorflow训练好的模型,怎么调用?

YOLO v3 包括Tiny-Yolo 训练自己的数据集(Pytorch版本)以及模型评价指标的介绍

R语言︱机器学习模型评价指标+(转)模型出错的四大原因及如何纠错