提高扫描文档的 OCR 准确性

Posted

技术标签:

【中文标题】提高扫描文档的 OCR 准确性【英文标题】:Improve OCR accuracy from scanned documents 【发布时间】:2011-06-07 04:51:24 【问题描述】:

我正在使用标准的 Brother A3 Multifunction 扫描大量 A3 文档,然后使用 FineReader Pro 对图像进行 OCR 处理。

但是,我在识别的字符中有很多错误,还有很多非字母数字的奇怪字符。

谁能给我一些关于以编程方式提高 OCR 准确性的提示,无论是对扫描的图像进行预处理,还是对识别的文本进行后处理?


编辑:Find a sample pdf。它包括一些我得到最差结果的示例图像。

【问题讨论】:

这个问题和编程有什么关系? 图像处理是数学/编程amzn.to/ef6KR4 【参考方案1】:

您是否有可以在某处发布的示例图片,然后我们可以快速告诉您是什么导致了您的大部分问题。 FineReader 是目前最好的 OCR 引擎之一,因此您的结果不佳肯定是有原因的。

这可能与较差的对比度和阈值设置、图像倾斜、扫描仪中的脏滚轮、复杂和彩色背景、抖动背景、字体太小、扫描 dpi 太低等有关...

看到附图后发现了一些小问题。

    背景页面上有很多脏污点。 FineReader 似乎在您的图像上做了合理的工作。 有一些轻微的偏差,但这不会导致问题。 FineReader 与用于列标题的粗体 Arial 字体混淆了。 4 一个大问题似乎是页面底部区域对比度差,图像模糊。这似乎是扫描仪的问题,但可能是由于打印问题。

印刷质量很差,我猜是从报纸上扫描的。大多数错误是由于扫描问题造成的,因此很难以编程方式改进结果。

首先,我会尝试使用稍高的分辨率以灰度扫描图像,看看是否有帮助。 FineReader 适用于灰度图像。如果您必须拥有黑白图像,请查看扫描仪驱动程序是否包含动态阈值设置并将其打开。

对于任何 OCR 引擎来说,您的图像都不是一件容易的事。如果您可以改进扫描,您将获得更好的结果。第 3 页的右下角有很多噪音。

您使用的是哪个版本的 FineReasder? FR10 可能会比以前的版本提供更好的结果。

【讨论】:

感谢您的帮助!我将遵循您的建议并比较结果。是的,我确实使用 FR10。

以上是关于提高扫描文档的 OCR 准确性的主要内容,如果未能解决你的问题,请参考以下文章

OCR 文档扫描 .NET SDK [关闭]

OCR文字识别谁最好?4款拍照扫描应用横向对比

最准确的日语开源 OCR? [关闭]

具有表格或行的文档的 Tesseract OCR 文本顺序

使用计算机视觉深入学习和创建现代OCR管道

计算机视觉项目-文档扫描OCR识别