SVM 多类文本分类

Posted

技术标签:

【中文标题】SVM 多类文本分类【英文标题】:SVM Multiclass text classification 【发布时间】:2011-03-21 03:48:03 【问题描述】:

我想对新闻数据集和训练数据进行分类,使用 IPTC 主题代码(分层分类)。 在我的项目中,我应该使用 svm 。

我已经完成了所有的特征提取、词干提取、去除停用词...

我几乎拥有了 svm 多类所需的文件格式:

就像:

category  feature:value feature:value feature:value

我不知道我应该如何使用 svmmulticlass

我也听说过一对一,我不知道是什么

请告诉我哪里可以找到一些关于它的教程,或者如何使用它

问候

【问题讨论】:

【参考方案1】:

one -against-all,是一种在多标签分类中训练 SVM 的技术,例如你有“n”类标签:所以你创建一个“n”SVM 并将每个类训练为 +Ve标签和所有其他标签为 -Ve 标签。

这就是一对一的意思。你可以访问这个并在那里使用 Multi-Class SVM

http://svmlight.joachims.org/svm_multiclass.html

【讨论】:

【参考方案2】:

你应该从阅读A Practical Guide to Support Vector Classification开始

一种将 SVM(用于 2 类分类的自然方法)转换为多类分类器的方法。

【讨论】:

以上是关于SVM 多类文本分类的主要内容,如果未能解决你的问题,请参考以下文章

Encog中的多类SVM分类

使用 OpenCV 在多类分类中获取 SVM 分类分数

如何在多类文本分类问题中平衡数据?

多类文本分类,每类一个训练样例

在 CNN 提取特征之上使用 SVM - 如何进行多类分类?

将SVM用于多类分类