Lasvm 文档和信息 [关闭]
Posted
技术标签:
【中文标题】Lasvm 文档和信息 [关闭]【英文标题】:Lasvm documentation and information [closed] 【发布时间】:2013-07-23 04:07:47 【问题描述】:我有数千个用于训练和测试的样本,我想使用带有 RBF 内核的 SVM 对它们进行分类。问题是当使用 10k 或更多数据时,Libsvm 的 RBF 内核实现非常慢。性能缓慢的主要焦点是网格搜索。
我读到了 Liblinear 和 Lasvm。但是 liblinear 不是我想要的,因为带有线性内核的 Svm 通常精度低于 RBF 内核精度。
我正在搜索 Lasvm,但找不到有关它的有用信息。 The project site 对它的信息很差。我想知道 Lasvm 是否可以使用 RBF 内核或者它是否具有特定类型的内核,我是否应该扩展测试和训练数据,以及我是否可以通过交叉验证对我的内核参数进行网格搜索。
【问题讨论】:
这个问题似乎是题外话,因为它是关于统计而不是编程。 2015 年新闻:您可能想查看 vowpal wabbit 的相对较新的--ksvm
选项。它将 LASVM 实现为 vw
(在线内核 SVM)的缩减,一个简短的教程在 github.com/JohnLangford/vowpal_wabbit/wiki/ksvm.pdf 中,您可以使用 --kernel rbf
。不要忘记通过--l2
进行正则化
【参考方案1】:
LaSVM 也有一个 RBF 内核实现。根据我在大数据(>1.000 维度中>100.000 个实例)上的经验,它并不比 LIBSVM 快。如果你真的想对海量数据使用非线性内核,你可以试试EnsembleSVM。
如果您的数据确实很大并且您不熟悉集成学习,那么 LIBLINEAR 是您的最佳选择。如果您有大量输入维度,线性内核通常不会比 RBF 差多少,同时速度要快几个数量级。
【讨论】:
感谢您的回答。我的数据没有你引用的那么大(我的数据是 16k 用于训练,40k 用于测试)。 EnsembleSvm 比 Lasvm 快吗?您能帮我如何使用 Lasvm 进行参数选择吗?再次感谢。 根据您的使用方式,EnsembleSVM 可以比 LaSVM 快得多。以上是关于Lasvm 文档和信息 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章