使用 CBIR 和 OCR 进行图像比较

Posted

技术标签:

【中文标题】使用 CBIR 和 OCR 进行图像比较【英文标题】:Image Comparisson using CBIR and OCR 【发布时间】:2015-11-25 01:48:59 【问题描述】:

从事从给定图像中检索内容并与存储库中的其他图像进行比较并列出匹配图像的项目。

应该采取什么正确的方法来做到这一点,以便搜索最终不会变慢。

作为第一级过滤,我计划做的是使用任何图像查询(CBIR 技术)来检索与给定图像模式匹配的图像。 然后进行 OCR 获取图片内容并进行匹配检查。

如果有更好的方法,请告诉我。

【问题讨论】:

【参考方案1】:

完成的步骤

软件 1. 正方体 OCR 2. Image Magick - 用于图像清洁 3.Textcleaner脚本

    使用Image Magick软件找出图像方向

    Convert 包具有使用 EXIF 数据查找图像方向的功能,但该功能不是很有用。 对于此图像已旋转 90 度三次,并将每个图像的 ocr 数据与另一个进行比较以找到正确的方向。 (字数最多的图片获胜)

    对图像进行 OCR 以获取文本并应用过滤以获取账单编号、日期和金额。

    成功时将详细信息存储在数据库中以供将来搜索 失败 使用不同的滤镜(灰度模式和锐化)创建了 10 张不同的图像 对所有图像进行 OC 扫描,从获取的所有数据中找出所需的数据。

    保存的数据用于将来的搜索功能以消除重复

【讨论】:

以上是关于使用 CBIR 和 OCR 进行图像比较的主要内容,如果未能解决你的问题,请参考以下文章

CBIR索引策略

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集原理和产品化应用

利用AForge+Tesseract制作视频OCR程序

在 OCR 之前清洁图像?

开发函数计算的正确姿势——OCR 服务

开发函数计算的正确姿势——OCR 服务