识别 SVM 中可能的过拟合

Posted

技术标签:

【中文标题】识别 SVM 中可能的过拟合【英文标题】:identifying possible overfitting in SVM 【发布时间】:2013-12-13 10:04:40 【问题描述】:

SVM 可以通过正确选择参数来避免过度拟合。如何知道经过训练的 svm 是否过拟合?有没有办法识别?如何避免?使用看不见的数据进行测试有帮助吗?

【问题讨论】:

我不确定是否有规范的方法可以做到这一点,但可能更简单的方法是比较测试数据集和验证数据集之间的结果。结果之间的巨大差异可能表明存在泛化问题。 【参考方案1】:

libSVM 元训练正是为您做的。如果您有(元)训练看不到的数据,您可以对此测试数据进行预测,并将其性能与训练数据的性能进行比较。小的差距是可以的,而大的差距是过度拟合或训练数据太少的指标。

【讨论】:

以上是关于识别 SVM 中可能的过拟合的主要内容,如果未能解决你的问题,请参考以下文章

如何识别 Python 中的过拟合和欠拟合

机器学习中的过拟合问题

scikit learn中的SVM过拟合

如何降低神经网络模型的过拟合和欠拟合?

机器学习中的过拟合与正则化详解

什么是机器学习中的过拟合和噪声?