从扫描图像中捕获数据的工具 [关闭]

Posted 2023-04-17

技术标签:

【中文标题】从扫描图像中捕获数据的工具 [关闭]【英文标题】：Tools for Data Capturing from Scanned Images [closed] 【发布时间】：2010-09-25 11:45:05 【问题描述】：

从扫描图像中获取数据的最佳工具有哪些？不管他们是免费的还是付费的。他们应该能够将扫描的图像转换为数据（文本、图像、表格等）。 最重要的是，他们应该拥有与 .NET 2.0 集成以实现自动化的 API。

编辑：输入的数据一般会是图片中的文字、图片、表格位置。这些图像基本上是来自包含数据的目录的扫描页面。

【问题讨论】：

【参考方案1】：

以下是一些示例产品：

Aspire

Ocrtools

All these SourceForge .NET OCR's

【讨论】：

【参考方案2】：

奇怪，但这里的大多数答案都是关于 OCR 库的，不管问题本身是否将数据捕获作为主要任务。

市场上有很多Data Capture应用，但说到SDK，我只能推荐ABBYY FlexiCapture Engine：http://abbyy.com/flexicapture_engine/

它为您提供了非常强大的可视化工具，可以根据不同的规则定义字段提取逻辑，批量测试，然后在与您的应用程序链接的 SDK 中使用此描述。这种字段提取技术一开始有点复杂，但可以处理一些比较困难的事情，比如表格分成几页等等。免责声明：我为 ABBYY 工作

【讨论】：

【参考方案3】：

ABBYY FineReader OCR API 符合 COM，可用于 C/C++、Visual Basic、.Net、Delphi 等。

【讨论】：

【参考方案4】：

你是说OCR (Optical Character Recognition)？

【讨论】：

【参考方案5】：

我建议您查看ReadIris Pro，它声称具有自动文档处理功能。很有可能它有某种形式的 API，尽管我还没有真正验证过。

我知道它对文本、表格和手写（全部大写的手写）很满意，而且还可以识别条形码。

虽然确实很贵，但也不算贵。

【讨论】：

【参考方案6】：

您可以使用Amazon's Mechanical Turk 中的人员，您可以对人员进行编程以做任何您想做的事情，您可以查看他们的API documentation 了解更多信息。

【讨论】：

【参考方案7】：

AForge 有很多有用的机器视觉资料。

【讨论】：

【参考方案8】：

IBM DataCap、EMC-Captiva inputaccel 怎么样？

【讨论】：

以上是关于从扫描图像中捕获数据的工具 [关闭]的主要内容，如果未能解决你的问题，请参考以下文章