在 OCR(光学字符识别)之前,您会推荐啥软件用于图像增强? [关闭]

Posted

技术标签:

【中文标题】在 OCR(光学字符识别)之前,您会推荐啥软件用于图像增强? [关闭]【英文标题】:What software would you recommend for image enhancement prior to OCR (Optical Character Recognition)? [closed]在 OCR(光学字符识别)之前,您会推荐什么软件用于图像增强? [关闭] 【发布时间】:2010-09-13 15:39:57 【问题描述】:

我们目前正在研究在提交给 OCR 之前提高图像质量的方法。我们目前使用的 OCR 引擎是 Nuance (v15) 的 Scansoft API。我们正在研究Lead Tools,但后来决定寻找其他地方。与 Lead Tools 相关的许可成本太高了。首先,我们正在寻找简单的图像增强功能,例如:去歪斜、去斑点、去除线条、去除打孔、锐化等。我们正在运行 .NET 和 Java 软件的混合,但首选 Java 解决方案。

【问题讨论】:

【参考方案1】:

Kofax 非常适合进行预处理,但对于您所说的清理类型,可能会有些过头,除非图像真的很糟糕。除非您的专长是图像处理,否则我建议您与执行图像清理和 OCR 的提供商合作,这样您就可以专注于您实际增加的价值。

我们从 ABBYY (ABBY SDK) 获得了 OCR 开发套件的许可,发现它在图像处理和 OCR 方面都非常出色。 API 非常广泛,示例应用程序、帮助和支持令人印象深刻。我绝对建议您看看。

【讨论】:

【参考方案2】:

免责声明:我为 Atalasoft 工作

我们为 .NET 提供这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还有 OCR 组件,包括用于 Abbyy、Tesseract 等的 .NET 包装器以及可搜索的 PDF 生成(PDF 中文本顶部的图像)

【讨论】:

【参考方案3】:

不确定这是否完全符合你们需要的标准,但也许您应该查看一些Paint.Net API。我不知道提取他们的图像处理算法以用于您的项目有多么容易,但我相信他们会做一些您正在寻找的事情。此外,它是一个具有 MIT 许可证的开源项目,因此对于商业用途应该非常友好。

【讨论】:

【参考方案4】:

在 KOFAX.com 上对 KOFAX VRS 的研究

【讨论】:

【参考方案5】:

也许是JMagick,它是ImageMagick 的一个开源Java 接口。它以薄 Java 本机接口 (JNI) 层的形式实现到 ImageMagick API。它是根据 LGPL 获得许可的,因此在许可方面应该不会有问题。

http://sourceforge.net/projects/jmagick/

【讨论】:

【参考方案6】:

我建议 Intel 使用它的零成本运行时许可。

【讨论】:

【参考方案7】:

取决于原始图像的数量和质量。托管代码和成像工具包可以工作,但如果您要处理数百万张图像,它并不总是最好的解决方案。对于小批量和紧张的预算,我同意以前的海报,即像 Aforge、Paint.NET 和其他开源计算机视觉库这样的项目可以解决问题。当然,如果结果没有改善,您就只能靠自己了……至少这可以让您以低成本将所需的一切都放在一个应用程序中。

如果您每月要处理数十万张图像,那么我建议您将流程划分为更小的工作流程步骤并调整每个步骤,直到您的每张图像成本尽可能接近于零。您会发现 OCR 结果一开始上升很快,然后比您预期的更快趋于平稳。 (我不是 OCR 的忠实粉丝,但它有它的位置)

我使用来自 Recogniform 的商业 Windows 产品,使用针对各种图像调整的脚本以批处理模式在 OCR 之前处理和清理图像。如果图像未通过 QC 或被 OCR 引擎拒绝,则会使用使用 Atalasoft 的 工具包构建的自定义 .NET 应用程序手动“修复”它。批处理一切,只触及失败的部分。

【讨论】:

以上是关于在 OCR(光学字符识别)之前,您会推荐啥软件用于图像增强? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

OCR文本识别软件提示说无法对该语言执行OCR,请将您的OCR语言设置更改为可用的OCR语言是啥问题?

LabVIEW OCR 实现车牌识别

OCR (Optical Character Recognition,光学字符识别)

光学字符识别技术

光学字符识别技术

通过字段识别和光学字符识别(OCR)进行数据输入自动化,用于预定义表格上的手写