如何训练深度学习网络
Posted
技术标签:
【中文标题】如何训练深度学习网络【英文标题】:how to train deep learning network [closed] 【发布时间】:2018-01-09 03:48:30 【问题描述】:有两件事我不知道如何处理它们。
-
我用 alexnet 训练了网络,它无法收敛。并且没有过拟合。然而,当我用 lenet 训练网络时,它收敛了。这是为什么呢?
我训练了网络来解决问题。它收敛了,但还不够。 softmax 损失不能更低(0.2)。我该如何处理呢。
【问题讨论】:
【参考方案1】:无法过拟合可能是由于网络容量不足或代码本身存在错误。你是从头开始训练模型吗?你自己写的模型?您是否正在从事与 Imagenet 分类类似规模的任务?
在任何类型的模型训练过程中都会出现损失的平稳期。但是如果没有任何学习曲线显示跨时期的损失,“0.2”的损失是没有意义的。
如果不知道您正在处理的确切任务、您使用的框架、源代码、学习曲线和/或您已采取的任何调试步骤,没有人能够真正回答您的问题。我建议你回到 cs231 lectures(特别是第 4,5 讲)或 Andrew Ng's Coursera 课程中的机器学习基础知识,以获得更基础的知识。
【讨论】:
1.是的,我的 alexnet 模型中有一个错误。 2.谢谢你的建议。以上是关于如何训练深度学习网络的主要内容,如果未能解决你的问题,请参考以下文章