OCR中的图像预处理

Posted 2023-04-17

技术标签:

【中文标题】OCR中的图像预处理【英文标题】：Image pre-processing in OCR 【发布时间】：2014-10-07 13:48:46 【问题描述】：

我们的项目都是关于 OCR 的，并且基于我的研究，在执行字符识别之前，它将在预处理阶段进行。我知道我们可以为此使用 openCV，但我们不能根据我们的规则使用它。

我的问题是，谁能告诉我预处理的步骤和最好的方法/算法。

如我所知，

1.YUV亮度

2.灰度

3.otsu 阈值处理

4.二值化

5.霍夫变换

Original Image> YUVluminace> 灰度下一步是什么？？

谢谢！

【问题讨论】：

【参考方案1】：

在我的一些较早的博客文章中，我解决了您的一些问题：

对来自移动相机的各种图像质量进行二值化： http://www.ocr-it.com/guide-to-better-mobile-images-from-cell-phone-camera-for-higher-quality-ocr

图像预处理和分割以获得更好的 OCR： http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

根据我的经验，实际上，没有一步一步的。如果您愿意，您可以将原始图像用于 OCR，这意味着无需进行任何预处理。是的，预处理会有所帮助，但这取决于图像的来源和类型（您没有指定）。例如，使用 Kofax VRS 在专业扫描仪上扫描的典型办公文档不需要在 OCR 之前进行预处理。手机摄像头图像需要大量的预处理。来自停车场摄像头的图片需要进行大量预处理，但与手机摄像头图片不同的步骤和算法。

我认为确定图像中的下一个主要限制因素是什么，对其进行预处理，然后寻找下一个可纠正的问题。

【讨论】：

先生，非常感谢您回答我的问题，这对我很有帮助。

以上是关于OCR中的图像预处理的主要内容，如果未能解决你的问题，请参考以下文章

去除 OCR 图像处理中的背景颜色

R、tesseract 和预处理图像中的 OCR 表

ocr和图像预处理技术

为 OCR 准备复杂图像

首先有啥好的算法可以捕捉到像样的图像？之后是预处理/图像清洁，最后是 OCR 程序？

对低质量数字图像进行 OCR 的预处理方法？