pytesseract:将 7 段数字的图片转换为文本

Posted

技术标签:

【中文标题】pytesseract:将 7 段数字的图片转换为文本【英文标题】:pytesseract: convert pictures of 7-segment numbers to text 【发布时间】:2022-01-06 11:36:24 【问题描述】:

我正在尝试转换这样的图片: 使用 pytesseract 将 7 段文本转换为文本:

我尝试了不同的 PSM 模式和一个只有 0123456789 的白名单,但 pytesseract 的最佳输出是 '5' 而不是 '125'。

有没有办法配置 pytesseract 来转换我的图片?或者有什么扩展?

谢谢。

import pytesseract
from PIL import Image, ImageTk

img = Image.open('test.png')

text = pytesseract.image_to_string(img, config=("-c tessedit_char_whitelist=0123456789 --psm 7"))

print(text)

【问题讨论】:

【参考方案1】:
    阅读并关注docs 使用letsgodigital作为ocr“语言”

【讨论】:

不幸的是,letsgodigital 语言对我不起作用。许多价值观是错误的。 :( 它在您提供的图像上完美运行(如果您也阅读文档。)

以上是关于pytesseract:将 7 段数字的图片转换为文本的主要内容,如果未能解决你的问题,请参考以下文章

pytesseract在识别只有一个数字的图片时识别不出来

pytesseract img 到字符串的转换不起作用

使用自定义字体的 Pytesseract 错误地对数字进行分类

pytesseract 仅使用 tesseract 4.0 数字不起作用

pytesseract库的安装和使用

Python3.x:pytesseract识别率提高(样本训练)