keras训练完模型,为啥对训练集进行evaluate和训练时的loss完全不一样?白训练了吗?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了keras训练完模型,为啥对训练集进行evaluate和训练时的loss完全不一样?白训练了吗?相关的知识,希望对你有一定的参考价值。

如图1所示,我用keras建立好了model,用model.fit进行训练,显示训练集的数据loss已经接近1*e-5,而且第二个输出的性能度量 准确性已经是1了,然而接下来用model.evaluate对同样的训练集 (训 练 集!不是测试集,一共就400多条数据)进行测试,在过拟合的情况下理论上应该已经完美拟合了才对,然而实际情况如图2 ,就跟没训练过一样……这是为什么呢

参考技术A 问题简述:
在keras框架下使用model.fit得到的训练准确率和损失表现都非常好,但是在相同的训练集上使用model.evaluate得到的准确率和损失都非常差
keras中的model.fit和model.evaluate在同样的数据集上的准确率acc和损失值loss存在巨大的差异
https://github.com/keras-team/keras/issues/6977
上面的github链接讨论了多种可能,
1.model.fit和model.evaluate的batch_size不匹配:model.fit时若指定了batch_size,在使用model.evaluate时的batch_size默认为16,而使用model.evaluate时并未设置与使用model.fit时同样的batch_size。解释大概为不同的batch_size的BatchNormalizaiton会产生不同的效果不同(当然在神经网络中存在BatchNormalization层时)
结果:匹配batch_size了也无效
2.dropout,batchnorm的影响:model.fit时的dropout层是设置dropout参数的,比如说0.5,而model.evaluate设置的dropout参数为1,keras在使用这两个function的时候会呈现两种模式追问

真的是BN层的问题!把BN层消掉会改善很多!NB!

本回答被提问者采纳

以上是关于keras训练完模型,为啥对训练集进行evaluate和训练时的loss完全不一样?白训练了吗?的主要内容,如果未能解决你的问题,请参考以下文章

Keras训练神经网络进行分类并进行交叉验证(Cross Validation)

使用大数据集在 Google Colab TPU 上训练 seq2seq 模型 - Keras

验证码是怎么被机器识别的?Keras+CNN模型验证码识别详解

Keras:使用更大的训练集更新模型

如何在 Keras 中使用经过训练的模型进行预测

keras学习分类