适用于 Android 的完美 OCR 扫描
Posted
技术标签:
【中文标题】适用于 Android 的完美 OCR 扫描【英文标题】:Perfect OCR scanning for Android 【发布时间】:2014-02-28 10:19:04 【问题描述】:现在我正在制作一个使用 android OCR rmtheis(https://github.com/rmtheis/android-ocr) 作为脚手架的 OCR 应用程序。
但是,我还远远不够。
我的主要问题:
在扫描带有几种不同字体的超小文本时,它仅返回一小部分正确的包含字符 不相关的杂物,例如包含的图像和条形码(来自 在这种情况下是产品手册)。
自动对焦的循环方式是,如果您在图像最清晰时按下相机按钮,您可能会 0.02 秒为时已晚,扫描模糊图像。因此,当文本包含在所选视图中时,我更喜欢自动捕获。
是否有任何适用于 Android 的高质量 OCR 解决方案可以捕获棘手的小文本并几乎每次都正确处理?
澄清一下:我已经通过 android-ocr 项目使用了 tesseract(tess-two)
另一方面:它几乎每次都需要返回接近 100% 正确的结果。不需要语言支持,我只会用它来捕获诸如 842EAB842EAB842EAB84?2EAB842EAB842EAB 之类的代码,此外还有不相关的英文文本。因此,我根本不需要语言支持。
编辑:这似乎是我正在寻找的: http://www.abbyy.com/mobileocr/features/
有没有比 Abbyy 输出质量更高的解决方案?
【问题讨论】:
tesseract 是一个完善的库 - code.google.com/p/tesseract-android-tools 你确定它真的适合真正高质量的需求吗?扫描包含无关内容的微小文本时,会出现几个字符错误。 你有什么尝试 - 有关于提高扫描质量的好文档:code.google.com/p/tesseract-ocr/wiki/ImproveQuality 谢谢,但我希望 OCR 软件(或 OCR + 文本旋转软件)能够解决文本旋转等问题。而且我的意思不是 90/180/270 作为 gautam。我想 Android 应用程序构建这样的功能应该是相当标准的,所以我希望有一个多合一的包可以有效地从非常糟糕的图像中生成文本。 如果您需要比 ABBYY Mobile OCR Engine 更高的准确度,您应该尝试 Cloud OCR SDK (ocrsdk.com)。它使用与 ABBYY FineReader Engine 相同的核心技术——ABBYY 最强大的 OCR SDK。你可以在这里下载几个样本看看准确性:cloud.ocrsdk.com/Demo 【参考方案1】:我也一直在研究适用于 Android 的高质量和免费 OCR 解决方案,最后我在我的一个项目中选择了 tess-two fork,因为其他选项弊大于利。正如@realkarim 所说,它不是 100% 准确,但结果是最佳的。
Link 使用 tess-two 的 OCR 示例
试一试并评论我们您的体验;)
【讨论】:
【参考方案2】:嗯,一年前我计划创建一个需要 OCR 的 Android 应用程序,首先我很抱歉,但你不会找到免费的“适用于 Android 的高质量 OCR 解决方案” :/ 我使用了 tess-two,它是适用于 android 的最好的免费 OCR,但它仍然不是 100% 准确,可能如果我有更多时间,我可以添加一些图像处理来增强输出。
OCR 链接: https://github.com/rmtheis/tess-two
使用它的正在运行的应用程序示例: http://www.youtube.com/watch?v=Ho5DyK1hKdw
我的申请: http://www.youtube.com/watch?v=2PRQo7EWYd8
尝试一下,如果可以的话,在使用 OCR 之前对图像添加一些图像处理:)
【讨论】:
那么您的经验是什么?您推荐哪种付费解决方案? 我不知道任何付费解决方案。但是,创建我提到的第一个示例的人发布了他的代码 -> github.com/GautamGupta/Simple-Android-OCR 您可以查看它以了解如何最大程度地利用此 OCR。顺便说一句,他做得很好! 谢谢!但是拍照的时候尽量把手机旋转15度。它不会选择正确的文本。 Tesseract 没有给出很好的结果,可能很多训练可以提高。 嗨,我需要从硬拷贝(如当前账单等硬拷贝等)中扫描小文本(文本大小接近 8 到 10sp)。我正在使用这个 github.com/rmtheis/android-ocr 项目。如何扫描较小的文本?我在这里感到震惊。请尽快帮助我。在此先感谢。以上是关于适用于 Android 的完美 OCR 扫描的主要内容,如果未能解决你的问题,请参考以下文章
使用适用于 ANDROID 的 tesseract OCR 引擎示例项目时应用程序崩溃
适用于 .net 的免费 OCR SDK,可以将文本、带有格式和图像的表格提取到 Office word 文档中 [关闭]