如何训练深度学习网络

Posted

技术标签:

【中文标题】如何训练深度学习网络【英文标题】:how to train deep learning network [closed] 【发布时间】:2018-01-09 03:48:30 【问题描述】:

有两件事我不知道如何处理它们。

    我用 alexnet 训练了网络,它无法收敛。并且没有过拟合。然而,当我用 lenet 训练网络时,它收敛了。这是为什么呢? 我训练了网络来解决问题。它收敛了,但还不够。 softmax 损失不能更低(0.2)。我该如何处理呢。

【问题讨论】:

【参考方案1】:

    无法过拟合可能是由于网络容量不足或代码本身存在错误。你是从头开始训练模型吗?你自己写的模型?您是否正在从事与 Imagenet 分类类似规模的任务?

    在任何类型的模型训练过程中都会出现损失的平稳期。但是如果没有任何学习曲线显示跨时期的损失,“0.2”的损失是没有意义的。

如果不知道您正在处理的确切任务、您使用的框架、源代码、学习曲线和/或您已采取的任何调试步骤,没有人能够真正回答您的问题。我建议你回到 cs231 lectures(特别是第 4,5 讲)或 Andrew Ng's Coursera 课程中的机器学习基础知识,以获得更基础的知识。

【讨论】:

1.是的,我的 alexnet 模型中有一个错误。 2.谢谢你的建议。

以上是关于如何训练深度学习网络的主要内容,如果未能解决你的问题,请参考以下文章

tensorFlow-深度学习训练并行模式

如何异步加载和训练批次以训练深度学习模型?

深度强化学习 如何训练

如何将深度学习训练速度提升一百倍?PAISoar 来了

深度学习如何训练出好的模型

Python深度学习模型训练如何分别用多个数据集训练?