从大型数据集中识别被遮挡的纹理补丁

Posted

技术标签:

【中文标题】从大型数据集中识别被遮挡的纹理补丁【英文标题】:Identifying occluded texture patches from a large dataset 【发布时间】:2011-10-28 13:13:33 【问题描述】:

我手头的假设任务是能够从一张几何上未变形的饮料罐的上图中给出其分类(例如饮料的品牌和名称)。不需要分段。分类函数的输入只是一个视图,一个视图,可以从它的任何一侧看到。数据集应该很大,大约 2000 种不同的饮料。这些罐子都具有相同的尺寸。训练时,每个罐子都要旋转几百次,几乎可以包含任何角度。

有什么想法是解决这个问题的最佳方法吗?对我来说,这似乎是一个纹理识别问题,对象本身的形状无关紧要。分类也应该很快,所以排除了模板匹配。如果有人能为我指出正确的方向,那将是向前迈出的一大步。我想出的任何想法似乎都不适合这项任务。局部特征(SIFT/SURF)等?太笼统了。一个品牌可以在他们生产的不同饮料上使用相同的标志。神经网络?罐子在不同的侧面看起来可能会非常不同,如果它们都映射到相同的标签,这会打乱训练。词袋?用于训练 SVM 的 HOG/颜色直方图等?完全不同的东西,我不知道,也许我不知道?

【问题讨论】:

不知何故与您的问题有关:***.com/questions/6832257/… 【参考方案1】:

一种好的方法是对罐子的形状进行建模,这样您就可以将罐子中的纹理和标签映射到平面矩形。由此,您可以使用低分辨率版本或基于高斯金字塔的模板匹配进行模板匹配,以进行快速匹配。

第二个选项是提取此“平面化”图像的 SIFT 或 SURF 关键点,并尝试在训练集中找到相应的点。虽然相同的标志或文字可能会出现在几个不同的罐子上,但您可以使用关键点的位置来区分罐子。

【讨论】:

以上是关于从大型数据集中识别被遮挡的纹理补丁的主要内容,如果未能解决你的问题,请参考以下文章

从大型数据集中提取唯一数据

R中大型数据集中多个列的自动grep()

对从大型数据集中聚合的数据使用 Altair

使用python 脚本挑出coco 数据集中的某一类数据

tensorflow-实现knn算法-识别mnist数据集

tensorflow-实现knn算法-识别mnist数据集