如何使用带有词袋直方图的 libsvm

Posted

技术标签:

【中文标题】如何使用带有词袋直方图的 libsvm【英文标题】:how to use libsvm with histograms of bags of words 【发布时间】:2012-06-27 06:27:21 【问题描述】:

我已经设法将图像转换为视觉词的直方图表示。它可能是简单的,如下所示(标准化):

[0.1, 0.2, 0, 0.1, 0, 0.05, 0.3, 0, 0, 0, 0.2, 0.05, 0]

加起来是 1

现在,如果我对上面的直方图有很多不同的迭代,我想用 libsvm 对其进行分类。但我被困在这里,我知道 svmtrain 的语法:

model=svmtrain(label,training_matrix)

训练矩阵应该只是我所有直方图的 m x n 矩阵 但是标签呢?我知道它应该是 +1 或 -1,但负面图像来自哪里? training_matrix 中的所有内容都应该是代表班级的正面图像。

将每个直方图视为一个单独的实例我错了吗?相反,如果我将每个视觉单词都视为一个实例,那么我会从代表类的单词中得到否定。

【问题讨论】:

一般会使用 SVM 对实例进行分类,例如图像,到两个或更多类。你能澄清一下你的课程是什么吗?您是想区分两种类型的图像,还是给定图像中的“视觉词”(例如,识别其中的元素)? @etov 我正在尝试对图像进行分类 对,但是您要对图像进行什么分类?即,您是否有一些课程,例如人与风景与建筑物?如果是这种情况,为了构建“人物”分类器,您可以使用“人物”图像作为正面示例,将“风景”或“建筑物”图像用作负面示例。 另外:如果真的想对人/建筑物等进行分类 - 直方图不会让您获得非常高的准确度。 【参考方案1】:

我假设,您的类是具有视觉相似性的图像组。 那么:

每个图像都是一个实例 图像直方图只是转换/缩减的图像数据,因此每个图像直方图也是一个实例 直方图中的每个 bin 都是一个特征

我建议,您将直方图转换为文本文件并使用二进制工具和this description 进行第一次评估。

但是,如果颜色/强度不是对象的主要区别特征,我想仅直方图不会给出好的结果。

如果您有小图像,图像上只有对象而没有太多背景,更好的快速解决方案是将图像缩小到例如32x32 并使用像素值作为特征。

【讨论】:

以上是关于如何使用带有词袋直方图的 libsvm的主要内容,如果未能解决你的问题,请参考以下文章

如何在我的 Java 代码中使用带有 Weka 的 LibSVM?

带有预计算内核的 libsvm:如何计算分类分数?

LIBSVM 如何准备带有图像的训练数据集以进行徽标检测?

SLAM闲谈--词袋模型

如何在 Spark 中正确地将数字特征与文本(词袋)结合起来?

如何在带有Canvas的Kibana中使用Elastic SQL绘制时间序列直方图?