渐进式网络应用 OCR SDK (JavaScript)

Posted

技术标签:

【中文标题】渐进式网络应用 OCR SDK (JavaScript)【英文标题】:progressive web app OCR SDK (JavaScript) 【发布时间】:2018-05-11 19:59:14 【问题描述】:

我们开发了一个使用 OCR 技术的网络应用程序。我们使用付费的 API 服务,效果很好。 我们的后端/服务器使用基于 Ruby/Rails 的 API,我们的前端/客户端使用 VUE.js。 现在 OCR 技术是服务器端的,但我们也希望进入离线/PWA(渐进式 Web 应用程序)市场,目前正在开发我们应用程序的离线版本。由于我们应用程序的 OCR 部分必须在客户端运行,我们将 OCR 技术也移动到客户端,这意味着我们必须使用某种与 PWA 兼容的 OCR 技术,例如javascript SDK

我可能已经搜索了整个互联网,但似乎并没有真正的解决方案。这一切都归结为两大供应商:

tesseract / 可能是最大的 OCR 项目(开源)。他们提供了一个 JS SDK (tesseract.js) -> http://tesseract.projectnaptha.com/ 但这很糟糕。我们将结果与我们正在使用的 API 进行了比较,结果很糟糕。因此,我们不能使用它。 ABBYY 这可能是网络上最著名的 OCR 提供商,他们以合理的价格提供 OCR 扫描。不幸的是,在打电话给他们之后,他们也没有为 PWA 提供任何解决方案,只针对本机应用程序 不幸的是,多个其他小项目使用了除 JS 库之外的所有内容

在放弃并考虑开发本机应用程序(这对我们来说将是成本密集型应用程序)之前,我考虑在这里询问是否已知任何我尚未考虑的 PWA 的 OCR 解决方案。谢谢

【问题讨论】:

你在 tesseract.js 中加载了 langdata 吗? 你试过OCRopus吗?我认为 The Vision API 可能会有所帮助 @DonMB >> 你有没有想过解决这个问题? 【参考方案1】:

您可以使用 ocrad.js 开源 javascript OCR 库:http://antimatter15.com/ocrad.js/demo.html | https://github.com/antimatter15/ocrad.js

它只有 3mb 大小,但在很多示例上都运行良好。

【讨论】:

【参考方案2】:

没有 JavaScript 解决方案,但您可以尝试 Scandit。它可以在所有平台旁边离线工作,并且可以使用 Cordova 进行 Web 集成。 https://www.scandit.com/tag/ocr/。或者使用最新的网络平台https://www.scandit.com/scandit-launches-barcode-scanner-sdk-for-web-brings-scanning-to-the-browser/

在这里试试: https://websdk.scandit.com/

【讨论】:

【参考方案3】:

Imense 提供针对 ID 读取市场(有限字符集)的编译客户端 JavaScript OCR 引擎。在https://www.imense.co.uk/OCR.html 有一个从 USB 摄像头输入读取文本的演示 该库不是免费的,演示需要 HTML5 支持。

【讨论】:

以上是关于渐进式网络应用 OCR SDK (JavaScript)的主要内容,如果未能解决你的问题,请参考以下文章

OCR身份证辨识SDK

用于 OCR 的 Google Drive SDK

免费或负担得起的 OCR 和 ICR(手写识别)SDK? [关闭]

是否有适用于 Android 和 iOS 的 OCR 开源库或 sdk(免费)? [关闭]

OCR识别证件识别——移动端识别SDK

证件阅读器API接口SDK二次开发APP应用