Abbyy Finereader 命令行用法/python 用法?
Posted
技术标签:
【中文标题】Abbyy Finereader 命令行用法/python 用法?【英文标题】:Abbyy Finereader command line usage / python usage? 【发布时间】:2014-03-20 01:16:03 【问题描述】:我有一个项目需要使用 OCR 扫描某些图像。
我知道软件 abbyy Finereader 做得很好(也尝试了一个对我来说几乎完美的试用版),现在我想知道如何将这个软件嵌入到 python 或其他 sripting 语言中,以便我以后可以简单地运行命令行脚本,例如python the_script.py image.jpg
以图像为参数,用它执行 abbyy Finereader 并返回识别的文本...
我在谷歌上找不到方法,没有!?我只发现了这样的东西: https://github.com/mikesname/python-ocrlab/blob/master/ocrsite/ocrlab/nodes/abbyy.py 但无法弄清楚它的真正作用......
或者我需要哪个 abbyy 软件来执行此操作!?识别服务器或 OCR 引擎或其他什么?
提前非常感谢
【问题讨论】:
我认为您应该从 abbyy 获得试用许可证,然后问他们。如果我没记错的话,您有权在试用期间获得支持。我已经尝试过他们的 cloud sdk,并且有一个您在 python 中描述的确切命令行示例。我认为他们所有的 sdk 产品都是一样的。 可能对 xorgar831 here 提供的这些 Linux shell scripts 感兴趣 【参考方案1】:我使用 ABBYY 技术已经超过 15 年了。我曾经在 ABBYY 工作,现在我在 WiseTREND 工作 - 美国主要的 ABBYY 技术 VAR 和集成商之一。
FineReader,即零售盒装产品,专为操作员独立交互式使用而设计。该软件包中不提供命令行和 API 自动化。如果您的使用量很小,您可以将 FineReader 企业版用作一个简单的黑盒,将其设置为热文件夹,然后让您的脚本将图像放入该输入文件夹,等待处理,然后从输出文件夹中提取。
为了实现更好的自动化和集成,需要使用与 FineReader 不同的产品。
首先,决定您是想要本地软件还是基于云的 OCR。
云 - ABBYY、OCR-IT 和其他一些提供商通过 Web 请求提供 OCR。通常按页付费,无需购买软件。
本地 - 一些软件将在您的服务器上运行,并为您的脚本提供 OCR 功能,作为黑盒或通过直接 API。 Recognition Server 是为此考虑的下一个产品。最后,如果您正在开发需要将其分发给众多用户的大型应用程序,或者需要深入的 OCR 控制,那么 Engine SDK 是需要考虑的产品。
如果您想分享更多您希望如何集成 OCR,以及您需要实现哪些数量和功能,我们可以尝试进一步缩小范围。
【讨论】:
我将通过邮件与您联系,讨论缩小产品建议 - 问题(finereader 的命令行使用)已得到解答,谢谢!【参考方案2】:我很晚才看到这条消息,但我使用 ABBYY 命令行已有 10 年了。
我更喜欢 ABBYY 8,因为它可以更快地完成同样的工作并且不会打开任何 GUI。它带有FineOCR.exe:
"C:...\ABBYY FineReader 8\FineOCR.exe" %1 /lang 希腊英语 /send MsWord
它执行 OCR 并打开 MS Word。 FineOCR.txt 是一个简单的帮助文件。
关于 ABBYY 11、12(所有版本)有一个 FineCmd.exe。使用类似的东西:
"c:...\FineReader\FineCMD.exe" %1 /lang 希腊英语 /send MsWord
它做了 FineOCR 之前所做的事情(但没有 .txt 帮助文件)。
【讨论】:
以上是关于Abbyy Finereader 命令行用法/python 用法?的主要内容,如果未能解决你的问题,请参考以下文章
怎样使用ABBYY finereader把PDF转成可编辑文件