从扫描图像中捕获数据的工具 [关闭]
Posted
技术标签:
【中文标题】从扫描图像中捕获数据的工具 [关闭]【英文标题】:Tools for Data Capturing from Scanned Images [closed] 【发布时间】:2010-09-25 11:45:05 【问题描述】:从扫描图像中获取数据的最佳工具有哪些?不管他们是免费的还是付费的。他们应该能够将扫描的图像转换为数据(文本、图像、表格等)。 最重要的是,他们应该拥有与 .NET 2.0 集成以实现自动化的 API。
编辑:输入的数据一般会是图片中的文字、图片、表格位置。这些图像基本上是来自包含数据的目录的扫描页面。
【问题讨论】:
【参考方案1】:以下是一些示例产品:
Aspire
Ocrtools
All these SourceForge .NET OCR's
【讨论】:
【参考方案2】:奇怪,但这里的大多数答案都是关于 OCR 库的,不管问题本身是否将数据捕获作为主要任务。
市场上有很多Data Capture应用,但说到SDK,我只能推荐ABBYY FlexiCapture Engine:http://abbyy.com/flexicapture_engine/
它为您提供了非常强大的可视化工具,可以根据不同的规则定义字段提取逻辑,批量测试,然后在与您的应用程序链接的 SDK 中使用此描述。这种字段提取技术一开始有点复杂,但可以处理一些比较困难的事情,比如表格分成几页等等。免责声明:我为 ABBYY 工作
【讨论】:
【参考方案3】:ABBYY FineReader OCR API 符合 COM,可用于 C/C++、Visual Basic、.Net、Delphi 等。
【讨论】:
【参考方案4】:你是说OCR (Optical Character Recognition)?
【讨论】:
【参考方案5】:我建议您查看ReadIris Pro,它声称具有自动文档处理功能。很有可能它有某种形式的 API,尽管我还没有真正验证过。
我知道它对文本、表格和手写(全部大写的手写)很满意,而且还可以识别条形码。
虽然确实很贵,但也不算贵。
【讨论】:
【参考方案6】:您可以使用Amazon's Mechanical Turk 中的人员,您可以对人员进行编程以做任何您想做的事情,您可以查看他们的API documentation 了解更多信息。
【讨论】:
【参考方案7】:AForge 有很多有用的机器视觉资料。
【讨论】:
【参考方案8】:IBM DataCap、EMC-Captiva inputaccel 怎么样?
【讨论】:
以上是关于从扫描图像中捕获数据的工具 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章