CBIR索引策略

Posted

技术标签:

【中文标题】CBIR索引策略【英文标题】:CBIR indexing strategy 【发布时间】:2012-12-22 06:45:35 【问题描述】:

我正在开发要集成到车牌识别应用程序中的 CBIR 解决方案。图像匹配算法非常强大,但您可以想象数据库很大,从数据库中提取图像进行匹配非常慢。我试图用小的局部特征向量甚至单个数值来量化图像,但没有成功。这个想法是索引一些这样的值,以允许真正快速提取,同时大大减少匹配候选者的数量。我已经阅读了很多关于该主题的论文,但其中大多数都将分类和机器学习作为解决方案。由于我没有看到分类如何有用,因为所有图像都非常相似(车牌图片),我想与过去有类似问题的人讨论想法,甚至是有一些问题的人关于我如何解决这个问题的线索。很长一段时间以来,我一直在努力想办法解决这个性能问题,但没有太多成功。

【问题讨论】:

不,它实际上是一个图像指纹识别应用程序......给定两张图像,我们确定它是否是同一个车牌。 【参考方案1】:

鉴于 cmets 中的附加信息,我将通过以下方式解决问题:

从图像中检测/分割板;

应用 OCR 以从车牌中提取带有字母和数字的字符串;

为了验证两个图像是否对应同一个车牌,比较两个字符串。另请注意,与多维特征向量相比,索引字符串更加容易和高效。

【讨论】:

这是一个非常好的建议,我们已经想到了。它确实可以解决我们所有的问题,但问题是,由于商业模式相关的东西,指纹必须完全独立于任何 OCR 模块:\ 但同样,这是一个非常好的建议。 为什么它必须独立于 OCR 模块?是因为你不能使用外部库吗?如果OCR算法是你们自己实现的,会是一个有效的解决方案吗? 关键是您从图像中提取的任何特征(即特征向量)对于您的任务来说都不会像车牌字符那样健壮。 没错!我们不能使用的原因是我老板强加的一些业务逻辑:我目前正在研究图像形状量化,看看有没有发现。

以上是关于CBIR索引策略的主要内容,如果未能解决你的问题,请参考以下文章

索引优化策略

索引优化策略

MySQL高性能索引策略

ES实战索引生命周期管理

ES实战索引生命周期管理

聊一聊 InnoDB 引擎中的这些索引策略