Java OCR 库推荐? [复制]
Posted
技术标签:
【中文标题】Java OCR 库推荐? [复制]【英文标题】:Java OCR library recommendations? [duplicate] 【发布时间】:2013-07-22 10:33:21 【问题描述】:我需要检查大量图片,看看它们是否有关键字。谁能推荐一个好的、可靠的 OCR 库?我很乐意牺牲速度来换取准确性。
【问题讨论】:
威卡怎么样? weka.wikispaces.com/Use+WEKA+in+your+Java+code 【参考方案1】:没有具有something to do with accuracy 的纯Java OCR 库。根据您的预算,您可以选择不是纯 Java,但可以从 Java 调用的东西:
如果您有充足的时间但预算为零 - 您的选择是 Tesseract。它绝对是开源中最好的 如果您的预算很少,并且您只需要运行一次此识别 - Cloud OCR API 服务将是您的最佳选择。它基于领先的商业级 OCR 引擎,并提供相当实惠的每个项目价格。免责声明:我为 ABBYY 工作 如果您需要将此识别作为持续过程永远运行,那么您可能会认为购买专用转换软件在经济上更有效,例如this one,它具有API并且也可以从Java调用。但实际上有很多选择,如果您准备在许可方面投入一些预算。【讨论】:
仅供参考.. tesseract sux..wayyyy 需要进行大量预处理,但开源,最好只花费您需要进行准确处理的 $$.. 准确的 OCR 只是这些要求之一那就是“付费玩”【参考方案2】:如果您有计划不识别拉丁或数字符号,那么更好的方法是找到非 java 库,但从一些(外部)工具中选择并使用其他方式 (1) 来获取您的文本。 在 Linux 上,我通过命令行界面使用了楔形文字 (2)。
例如命令行界面和管道。
楔形文字已移植到 Linux,但我不知道 Windows 的工作命令行界面
【讨论】:
以上是关于Java OCR 库推荐? [复制]的主要内容,如果未能解决你的问题,请参考以下文章