用于文档 OCR/可读性的图像处理/增强算法?

Posted

技术标签:

【中文标题】用于文档 OCR/可读性的图像处理/增强算法?【英文标题】:Image processing/enhancement algorithms for document OCR / readability? 【发布时间】:2010-10-17 10:42:12 【问题描述】:

我正在寻找算法、论文或软件来增强传真、来自手机摄像头的图像以及其他类似来源的可读性和 OCR。

我主要对简单的增强功能感兴趣(例如,您可以使用 ImageMagick 做的事情),但我也对更复杂的技术感兴趣。我已经在和供应商谈过了,所以对于这个问题,我主要是在寻找算法或开源软件。

进一步澄清:我不是在寻找 OCR 软件或算法;我正在寻找算法来清理图像,使其看起来对人眼更具可读性,并且可能用于 OCR。

【问题讨论】:

【参考方案1】:

我在编写一些软件进行书籍扫描时遇到了类似的问题;在互联网上流传着一个名为pagetools 的程序,它使用一种称为 Radon 变换的相当聪明的数学技巧来拉直扫描的页面。

我还编写了一个小程序,可以将页面上的空白区域变白;当 OCR 算法不必与背景噪声抗衡时,它们往往会做得更好。我所做的是寻找距离深色像素超过一个小半径的浅色像素,然后将它们提升为纯白色。

不过已经有几年了,所以我手头没有确切的实现细节。

【讨论】:

【参考方案2】:

一个简单的图像过滤器是“中值过滤器”,这是一个非常简单、易于实现的过滤器,可帮助清理扫描/拍摄的文本。 http://en.wikipedia.org/wiki/Median_filter

【讨论】:

【参考方案3】:

根据要求,链接至***:Optical character recognition

微软研究院:Optical character recognition papers

CiteSeerX : Papers on optical character recognition

【讨论】:

是的,我也想知道这篇文章在哪里。

以上是关于用于文档 OCR/可读性的图像处理/增强算法?的主要内容,如果未能解决你的问题,请参考以下文章

图片文档倾斜矫正算法 附完整c代码

用于图像去雾的优化对比度增强算法

在 OCR 之前检查图像质量

图像增强基于区域相似变换函数和蜻蜓算法的灰度图像增强

在 OCR 之前清洁图像?

数平精准推荐 | OCR技术之数据篇