提高屏幕截图上的 Tesseract OCR 准确性

Posted

技术标签:

【中文标题】提高屏幕截图上的 Tesseract OCR 准确性【英文标题】:Improving Tesseract OCR accuracy on screenshot 【发布时间】:2019-11-02 03:49:32 【问题描述】:

屏幕截图上的 tesseract OCR 给出了相当不稳定的结果。即使图像是全黑的,上面有白色的文字,似乎也只有一些文字可以被正确识别。即使在我将图像大小调整为300dpi 之后,准确性仍然很低,并且大部分文本都是乱码。

我在 *** 上阅读了类似的问题:Best way to recognize characters in screenshot?

如前所述,问题的作者通过使用他的字体训练 tesseract 引擎能够获得近 100% 的准确率。

我图片中的字体是 Arial。我怎样才能提高准确性???

这是我拥有的图像类型的示例: Image Sample

【问题讨论】:

【参考方案1】:

您可以通过更改 --psm 和 --oem 值来调整 OCR 的配置

尝试: --psm 5 --oem 2

您还可以查看以下链接了解更多详情 here

【讨论】:

【参考方案2】:

这个问题很老,但在谷歌搜索中首先出现,所以我想,我会回答。我有一个非常相似的问题,以为我会发疯,但偶然发现了这个页面:https://tesseract-ocr.github.io/tessdoc/ImproveQuality

上面写着: 反转图像 虽然 tesseract 版本 3.05(及更早版本)处理倒置图像(深色背景和浅色文本)没有问题,但对于 4.x 版本,使用浅色背景上的深色文本。

我用 ImageMagick 否定了图像,然后我们开始:100% 匹配!

【讨论】:

以上是关于提高屏幕截图上的 Tesseract OCR 准确性的主要内容,如果未能解决你的问题,请参考以下文章

Python tesseract 提高了 OCR 的准确性

提高 Python Tesseract OCR 的准确性

如何让 tesseract-ocr 从屏幕上的坐标读取?

Android Tesseract OCR 7 段数字

tesseract 的 OCR 结果高度不一致

识别屏幕截图中字符的最佳方法?