Android Tesseract OCR 7 段数字
Posted
技术标签:
【中文标题】Android Tesseract OCR 7 段数字【英文标题】:Android Tesseract OCR 7 Segment Digits 【发布时间】:2012-11-17 19:43:01 【问题描述】:我一直在实现一个 android OCR 工具,它只使用 tesseract 到 ocr 数字。到目前为止,它使用普通数字字体提供了相当高的准确性。然而,当涉及到 7 段数字(在 LCD 上发现的数字)时,精度很差。
我已经尝试裁剪我的图像,将 0 到 9 列入白名单,并且还进行了一些图像处理,但均无济于事。关于如何提高准确性的任何想法?或者也许一些关于为 tesseract 训练特定 7 段数字的技巧肯定会对我有很大帮助。
提前致谢。
【问题讨论】:
我不认为你不重新训练就可以获得好的结果。如果有一个公开可用的 7 段数字的训练数据文件会很好,但是当我查看时找不到。 感谢您的回复。你的博客在我的实施过程中真的帮助了我很多。所以,非常感谢你。我计划训练它,并正在研究 bbtesseract 的拳击过程。如果有人能分享一些关于培训过程的提示,我将不胜感激,因为官方的提示让我有点困惑。 您可以使用jTessBoxEditor 编辑或生成TIFF/box 文件以用于训练。还有一个 PowerShell 脚本train.ps1
可帮助自动化其余的培训。
@laurie7:你找到了训练 tesseract 的好例子吗
tesseract img.png out -psm 7 digits 这个命令有帮助吗?
【参考方案1】:
您可以在以下位置找到 7 个段的训练数据:
https://github.com/arturaugusto/display_ocr/tree/master/letsgodigital
在同一存储库中还有一个示例 python 代码。
【讨论】:
你能告诉我你是如何只为数字训练 tesseractor 的吗? 我使用一种名为“让我们数字化”的字体生成了一些图像,使用 gimp 添加了一些噪声,使用jTessBoxEditor 生成框数据并使用this 工具进行训练。阅读tesseractocr FAQ 了解更多详情。我还分享了@987654325@以上是关于Android Tesseract OCR 7 段数字的主要内容,如果未能解决你的问题,请参考以下文章
如何通过Tesseract开源OCR引擎创建Android OCR应用
如何通过Tesseract开源OCR引擎创建Android OCR应用
如何通过Tesseract开源OCR引擎创建Android OCR应用