为啥我们使用正则化来训练神经网络?

Posted

技术标签:

【中文标题】为啥我们使用正则化来训练神经网络?【英文标题】:Why do we use regularization for training neural network?为什么我们使用正则化来训练神经网络? 【发布时间】:2016-06-27 08:13:11 【问题描述】:

据我了解,我认为这是为了避免过度/欠拟合,并加快计算速度。 对吗?

【问题讨论】:

【参考方案1】:

您的理解部分正确。正则化无助于欠拟合。它可以(在某种程度上)防止过度拟合。此外,它不会加快计算速度(因为通过添加正则化来计算某些东西实际上更复杂),但可以导致更简单的优化问题 - 因此收敛所需的步骤数更少(因为产生的误差表面更平滑)。

【讨论】:

以上是关于为啥我们使用正则化来训练神经网络?的主要内容,如果未能解决你的问题,请参考以下文章

正则化(神经网络过拟合时的应对方法)

机器学习中「正则化来防止过拟合」到底是一个啥原理?

验证集与测试集有啥区别?为啥要分训练集、验证集和测试集?

神经网络为啥需要训练多轮运动

神经网络优化 - 正则化

为啥 50-50 的训练/测试拆分最适合使用此神经网络的 178 个观察数据集?