适用于 .net 的免费 OCR SDK,可以将文本、带有格式和图像的表格提取到 Office word 文档中 [关闭]

Posted

技术标签:

【中文标题】适用于 .net 的免费 OCR SDK,可以将文本、带有格式和图像的表格提取到 Office word 文档中 [关闭]【英文标题】:Free OCR SDK for .net which can extract text,tables with format and images into Office word document [closed] 【发布时间】:2011-10-25 13:22:31 【问题描述】:

我想要一个免费的 OCR SDK,它可以从扫描的文档文件(.tiff、.png 等)中提取文本、带有数据的表格和图像并存储到 Office Word 文档文件中。

请帮我解决这个问题。我已经使用 MODI 仅从图像中提取文本,但无法使用 MODI 如何提取表格和图像并存储到 Office Word 文档文件中。

【问题讨论】:

【参考方案1】:

我不确定开源 SDK 是否可以解决您的任务。根据您的描述,我看到您需要一个具有文档逻辑结构重构功能的复杂 ocr 应用程序。如果您正在计划商业软件,您可以查看ABBYY FineReader Engine。它有一组document analyzing and reconstruction features,提供c#的api,可以免费试用。免费使用的程序无法负担得起,但在商业软件方面——ABBYY OCR 技术可以为您的产品增加重要价值,因此请考虑尝试一下。我在 @ABBYY 工作,如有必要,可以为您提供更多信息。

最好的问候,尼古拉。

【讨论】:

以上是关于适用于 .net 的免费 OCR SDK,可以将文本、带有格式和图像的表格提取到 Office word 文档中 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

免费或负担得起的 OCR 和 ICR(手写识别)SDK? [关闭]

用于 OCR 的 Google Drive SDK

适用于 .NET Core 的 Facebook SDK

适用于 .NET 的视频聊天/会议 SDK 可行吗?

如何获得适用于 .NET 的 Sharp OSA SDK

OCR 文档扫描 .NET SDK [关闭]