如何训练 tesseract 只识别 20 到 30 位数字?

Posted

技术标签:

【中文标题】如何训练 tesseract 只识别 20 到 30 位数字?【英文标题】:How to train tesseract to recognize 20 to 30 digit numbers only? 【发布时间】:2015-07-09 07:35:19 【问题描述】:

我正在为我的项目使用tess-two Tesseract android 工具。根据我所做的研究,我从here 发现了一种限制字符类型而不是字符范围的方法。

    我使用的 Tess-Two 库没有 tessdata/config 文件,那么如何限制 tesseract 识别的可能字符?

    如何限制 Tesseract 识别数字范围(20 到 30)?

【问题讨论】:

你是指20-30之间的数字还是20-30位的数字? 20-30位数字 【参考方案1】:

如果您正在使用您的数字在图像中并且图像清晰,您可以使用以下命令 “tesseract imageName outputFileName.txt outputbase digits” 但如果图像不清晰,您将需要对其进行处理,否则您将无法获得准确的结果。 希望这会帮助你。

【讨论】:

以上是关于如何训练 tesseract 只识别 20 到 30 位数字?的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract-OCR-v5.0中文识别,训练自定义字库,提高图片的识别效果

训练 Tesseract 3 从燃气表的真实图像中识别数字

如何定义 tesseract 用于识别(而不是训练)的字体类型?

tesseract 安装与训练(图像识别)

图像识别—基于样本训练的tesseract

通过训练 tesseract 获得更好的识别结果