适用于 .net 的免费 OCR SDK,可以将文本、带有格式和图像的表格提取到 Office word 文档中 [关闭]
Posted
技术标签:
【中文标题】适用于 .net 的免费 OCR SDK,可以将文本、带有格式和图像的表格提取到 Office word 文档中 [关闭]【英文标题】:Free OCR SDK for .net which can extract text,tables with format and images into Office word document [closed] 【发布时间】:2011-10-25 13:22:31 【问题描述】:我想要一个免费的 OCR SDK,它可以从扫描的文档文件(.tiff、.png 等)中提取文本、带有数据的表格和图像并存储到 Office Word 文档文件中。
请帮我解决这个问题。我已经使用 MODI 仅从图像中提取文本,但无法使用 MODI 如何提取表格和图像并存储到 Office Word 文档文件中。
【问题讨论】:
【参考方案1】:我不确定开源 SDK 是否可以解决您的任务。根据您的描述,我看到您需要一个具有文档逻辑结构重构功能的复杂 ocr 应用程序。如果您正在计划商业软件,您可以查看ABBYY FineReader Engine。它有一组document analyzing and reconstruction features,提供c#的api,可以免费试用。免费使用的程序无法负担得起,但在商业软件方面——ABBYY OCR 技术可以为您的产品增加重要价值,因此请考虑尝试一下。我在 @ABBYY 工作,如有必要,可以为您提供更多信息。
最好的问候,尼古拉。
【讨论】:
以上是关于适用于 .net 的免费 OCR SDK,可以将文本、带有格式和图像的表格提取到 Office word 文档中 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章