OCR中的图像预处理

Posted

技术标签:

【中文标题】OCR中的图像预处理【英文标题】:Image pre-processing in OCR 【发布时间】:2014-10-07 13:48:46 【问题描述】:

我们的项目都是关于 OCR 的,并且基于我的研究,在执行字符识别之前,它将在预处理阶段进行。我知道我们可以为此使用 openCV,但我们不能根据我们的规则使用它。

我的问题是,谁能告诉我预处理的步骤和最好的方法/算法。

如我所知,

1.YUV亮度

2.灰度

3.otsu 阈值处理

4.二值化

5.霍夫变换

Original Image> YUVluminace> 灰度下一步是什么??

谢谢!

【问题讨论】:

【参考方案1】:

在我的一些较早的博客文章中,我解决了您的一些问题:

对来自移动相机的各种图像质量进行二值化: http://www.ocr-it.com/guide-to-better-mobile-images-from-cell-phone-camera-for-higher-quality-ocr

图像预处理和分割以获得更好的 OCR: http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

根据我的经验,实际上,没有一步一步的。如果您愿意,您可以将原始图像用于 OCR,这意味着无需进行任何预处理。是的,预处理会有所帮助,但这取决于图像的来源和类型(您没有指定)。例如,使用 Kofax VRS 在专业扫描仪上扫描的典型办公文档不需要在 OCR 之前进行预处理。手机摄像头图像需要大量的预处理。来自停车场摄像头的图片需要进行大量预处理,但与手机摄像头图片不同的步骤和算法。

我认为确定图像中的下一个主要限制因素是什么,对其进行预处理,然后寻找下一个可纠正的问题。

【讨论】:

先生,非常感谢您回答我的问题,这对我很有帮助。

以上是关于OCR中的图像预处理的主要内容,如果未能解决你的问题,请参考以下文章

去除 OCR 图像处理中的背景颜色

R、tesseract 和预处理图像中的 OCR 表

ocr和图像预处理技术

为 OCR 准备复杂图像

首先有啥好的算法可以捕捉到像样的图像?之后是预处理/图像清洁,最后是 OCR 程序?

对低质量数字图像进行 OCR 的预处理方法?