python中支持向量机分类器的替代方案?

Posted

技术标签:

【中文标题】python中支持向量机分类器的替代方案?【英文标题】:Alternative to support vector machine classifier in python? 【发布时间】:2013-02-17 02:53:27 【问题描述】:

我必须在 155 个图像特征向量之间进行比较。每个特征向量都有 5 个特征。 我的图像分为 10 类。 不幸的是,我需要至少 100 张图像才能使用支持向量机,还有其他选择吗?

【问题讨论】:

kNN 有,但可能不如 SVM。 它使用欧式距离度量,混合所有值,它不关心有不同的特征 只有 155 个样本和 10 个类,你尝试的任何分类器都不会给你非常乐观的结果。但是你可以尝试像RandomForestClassifier 这样的合奏。 【参考方案1】:

对于任何机器学习模型来说,每类 15 个样本都非常少。与其浪费时间尝试许多模型类和参数,不如手动收集和标记新示例。它会更有成果。如果你有一堆未标注的图片,可以使用https://www.mturk.com/等服务。

【讨论】:

mturk 它不是免费的,也许它更容易找到一个指标,手动分析特征 如果你只有 10 个可能的类,mturk 上的图像分类任务可能只需 0.01 美元就可以找到工作人员,从而使 100 个额外图像的注释成本(前提是你首先拥有它们)只是1美元。当然,您仍然可以自己直接标记图片。如果您有数千个,则需要更长的时间。【参考方案2】:

查看 pybrain.http://pybrain.org。并且可能使用神经网络,因为我听说它们需要的训练数据比 svm 少,但准确度较低。

【讨论】:

【参考方案3】:

如果属于同一类的图像是对某个起始图像的转换结果,您可以通过对标记示例进行转换来增加训练规模。

例如,如果您要进行字符识别,则可以使用精细或弹性转换。 P.Simard 在应用于视觉文档分析的卷积神经网络的最佳实践中对其进行了更详细的描述。在论文中,他使用了神经网络,但同样适用于 SVM。

【讨论】:

以上是关于python中支持向量机分类器的替代方案?的主要内容,如果未能解决你的问题,请参考以下文章

支持向量机

R中支持向量机和朴素贝叶斯分类器的可变重要性

小白python机器学习之路——支持向量机

支持向量分类器的决策边界图(与分离超平面的距离)

基于前馈神经网络和支持向量机分类器的叶片识别

第五节:支持向量机