SVM 多类文本分类
Posted
技术标签:
【中文标题】SVM 多类文本分类【英文标题】:SVM Multiclass text classification 【发布时间】:2011-03-21 03:48:03 【问题描述】:我想对新闻数据集和训练数据进行分类,使用 IPTC 主题代码(分层分类)。 在我的项目中,我应该使用 svm 。
我已经完成了所有的特征提取、词干提取、去除停用词...
我几乎拥有了 svm 多类所需的文件格式:
就像:
category feature:value feature:value feature:value
我不知道我应该如何使用 svmmulticlass
我也听说过一对一,我不知道是什么
请告诉我哪里可以找到一些关于它的教程,或者如何使用它
问候
【问题讨论】:
【参考方案1】:one -against-all,是一种在多标签分类中训练 SVM 的技术,例如你有“n”类标签:所以你创建一个“n”SVM 并将每个类训练为 +Ve标签和所有其他标签为 -Ve 标签。
这就是一对一的意思。你可以访问这个并在那里使用 Multi-Class SVM
http://svmlight.joachims.org/svm_multiclass.html
【讨论】:
【参考方案2】:你应该从阅读A Practical Guide to Support Vector Classification开始
一种将 SVM(用于 2 类分类的自然方法)转换为多类分类器的方法。
【讨论】:
以上是关于SVM 多类文本分类的主要内容,如果未能解决你的问题,请参考以下文章