在 OCR 之前检查图像质量
Posted
技术标签:
【中文标题】在 OCR 之前检查图像质量【英文标题】:Check image quality before OCR 【发布时间】:2013-05-30 12:15:13 【问题描述】:我有对文档执行 OCR 的 android 应用程序。 我希望能够在将图像发送到服务器之前对其进行一些测试。 所以我的问题是在我将图像发送到服务器之前是否有任何工具/代码可用于测量图像焦点。 我希望能够知道图像是否不在焦点(不够清晰),以节省服务器端的处理时间而不是发送它。 谢谢 大卫
【问题讨论】:
现在手机速度很快。为什么不在客户端执行 OCR,然后将结果发送到服务器进行验证? github.com/rmtheis/tess-two/blob/master/eyes-two/jni/imageutils/… Boaz,你有这方面的更新吗 @rmtheis 链接失效 @rcvaram github.com/rmtheis/tess-two/blob/… 【参考方案1】:大卫,这是个好问题。当您收集更多反馈时,请与我们分享您的发现。
我已经使用并看到了几种用于处理这一重要步骤的技术。现实情况是,让用户拍一张好照片比检测或纠正一张床上照片要容易得多,这在很多情况下甚至是不可能的。所以检测很好,但这不应该是第一个动作。在图像检查之前可以触发的选项有很多,我将在下面列出一些。
过去对我有用,或对我共事过或听说过的人有用的技术(技术和非技术):
震动检测。使用设备的加速度来检查拍照时的晃动。很好的方法,但主要在明亮的灯光下工作。在黑暗的环境中,即使是轻微的晃动,画面也很容易被弄脏。此方法必须与其他方法结合使用。
设备上的二值化。它不仅可以让您压缩和准备图像以进行高效传输,还可以让您清楚地看到文本的质量。查看具有深色背景的彩色图像对于单个字符的清晰度而言并不像查看这些字符的黑白边缘那样明显。
预览屏幕。允许用户查看他们拍摄并即将提交的照片。我经常看到允许预览图片的应用程序,但是当我双击它时禁用了缩放。任何文本(即使它很糟糕)在小屏幕上看起来都不错,因为您实际上看不到文本。
我称之为“强制预览”。拍照后,最好是二值化后,自动缩放 10 倍,并要求用户确认是否看到清晰的文字。这似乎是侵入性的,所以一个好的设计在这里很重要,但这种方法是可靠的,因为它可以作为一个必需的步骤。
简单的指导说明... 如何拍出好照片!一些应用程序在首次运行时显示 ti 一次。有些应用程序让您有机会禁用。在我的应用程序中,我在 ios 上更新我的应用程序 FotoNote 后提供这些说明后,质量显着提高。
【讨论】:
以上是关于在 OCR 之前检查图像质量的主要内容,如果未能解决你的问题,请参考以下文章