如何通过 tesseract OCR 识别带有小数学符号的文本?

Posted

技术标签:

【中文标题】如何通过 tesseract OCR 识别带有小数学符号的文本?【英文标题】:How can I recognize text with little math symbols by tesseract OCR? 【发布时间】:2018-03-08 08:11:54 【问题描述】:

我的文字包含一些不那么复杂的数学符号,如下所示。

Tesseract OCR 默认无法识别此类数学符号(+-、角度)。如何通过 tesseract 识别这些数学符号?

【问题讨论】:

【参考方案1】:

只需使用以下语句:

pytesseract.image_to_string(Image.open(img), config='-l eng + equ')

还要确保 pytesseract 接受过方程式训练。

提菲

【讨论】:

以上是关于如何通过 tesseract OCR 识别带有小数学符号的文本?的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract OCR集成Android Studio实现OCR识别

如何提高Tesseract-OCR的识别精度

使用Python,OpenCV进行Tesseract-OCR绑定及识别

Tesseract-OCR 安装中文识别与训练字库

使用 Tesseract OCR 进行汉字识别

通过Tesseract实现简单的OCR