LibSVM 一类分类 nu 参数不是异常值的一小部分吗？

Posted 2023-03-12

技术标签:

【中文标题】LibSVM 一类分类 nu 参数不是异常值的一小部分吗？【英文标题】：LibSVM one class classification nu parameter is not a fraction of outliers? 【发布时间】：2014-03-16 17:23:04 【问题描述】：

如果我错了，请纠正我，但一类 SVM 理论指出，nu 参数是训练数据集中异常值的上限 (UB) 和 SV 数量的下限 (LB)。假设我使用的是 RBF 高斯核，那么通过 nu 参数的思想，无论我选择什么 gamma 值，模型都应该能够产生结果，使得参数 nu 是训练中异常值的 UB数据集？但是，这不是我通过在 Matlab 中使用 LibSVM 尝试一些简单示例所观察到的：

[heart_scale_label, heart_scale_inst] = libsvmread('../heart_scale');
ind_good = (heart_scale_label==1);
heart_scale_label = heart_scale_label(ind_good);
heart_scale_inst = heart_scale_inst(ind_good);
train_data = heart_scale_inst;
train_label = heart_scale_label;
gamma= 0.01;
nu=0.01;
model = svmtrain(train_label, train_data, ['-s 2 -t 2 -n ' num2str(nu) ' -g ' num2str(gamma) ' -h 0']);
[predict_label_Tr, accuracy_Tr, dec_values_Tr] = svmpredict(train_label, train_data, model);
accuracy_Tr

使用 gamma = 0.01 我得到训练数据的准确度为 97.50 使用 gamma = 100 我得到训练数据的准确度为 42.50 Shouldn't the model overfit to the data to get the same fraction of outliers in the training dataset, when larger gamma is selected?

【问题讨论】：

【参考方案1】：

其实我也发现了同样的问题。 SVM 的性能通常还取决于 γ 和 nu 的交互作用。如果在尝试调整另一个参数的同时修复一个参数，学习曲线似乎甚至不单调。

我在训练准确度、测试准确度（heart_scale 数据上的 5 倍）及其差异上绘制了三张图像。 γ 范围从10^(-4) 到10^(1)，nu 范围从10^(-3) 到10^(-1)：

为了更清楚地观察小参数，我在γ和nu轴上实现了对数，见下图：

对于给定的 120 个数据，基本上欠拟合比过拟合明显得多。

编辑

将 epsilon 值调整为1e-8 以填补上图所示的空白：

根本没有明显的过拟合或欠拟合！泛化误差对参数的依赖似乎有点违反直觉，可能是由于 libsvm 中使用的优化算法而不是“真正的”解决方案......

【讨论】：

您知道为什么 SVM 会以这种方式执行吗？我注意到，当结果与 nu 参数不一致时，模型的决策值通常很小，大约为 10^-5 左右。我有一个想法，如果与决策值相比，这可能是由于优化算法的一个很大的停止标准而发生的。您是否试图弄清楚为什么 SVM 会出现这样的行为？谢谢 MVil。你提出了一个很好的观点。使用“-e”选项，我的结果显示当两个参数都很小时没有欠拟合或过拟合。我猜这是由于 libsvm 应用的 SMO 算法。请注意，libsvm 优化非常快，因此预计会应用一些近似值。如果您使用其他东西来实现 svm（例如 scikit learn），您可以尝试比较两者的结果感谢您抽出宝贵时间 lennon310，我认为可以将此问题标记为已回答。不幸的是，由于一些实际的实施问题，理论结果有时仍然停留在理论上。我认为这是其中一种情况。再次感谢您的帮助。不客气。并感谢您接受我的回答。也期待更多关于 svm 的有趣发现（尽管很可能是由于软件问题）。只是为了再次确认，我们一直在讨论可能的计算错误，我已经从 LibSVM 软件的作者那里得到了答案。他们将此问题包含在他们的常见问题解答部分中。 csie.ntu.edu.tw/~cjlin/libsvm/faq.html#f425

以上是关于LibSVM 一类分类 nu 参数不是异常值的一小部分吗？的主要内容，如果未能解决你的问题，请参考以下文章