提高屏幕截图上的 Tesseract OCR 准确性

Posted 2023-02-19

技术标签:

【中文标题】提高屏幕截图上的 Tesseract OCR 准确性【英文标题】：Improving Tesseract OCR accuracy on screenshot 【发布时间】：2019-11-02 03:49:32 【问题描述】：

屏幕截图上的 tesseract OCR 给出了相当不稳定的结果。即使图像是全黑的，上面有白色的文字，似乎也只有一些文字可以被正确识别。即使在我将图像大小调整为300dpi 之后，准确性仍然很低，并且大部分文本都是乱码。

我在 *** 上阅读了类似的问题：Best way to recognize characters in screenshot?

如前所述，问题的作者通过使用他的字体训练 tesseract 引擎能够获得近 100% 的准确率。

我图片中的字体是 Arial。我怎样才能提高准确性？？？

这是我拥有的图像类型的示例： Image Sample

【问题讨论】：

【参考方案1】：

您可以通过更改 --psm 和 --oem 值来调整 OCR 的配置

尝试： --psm 5 --oem 2

您还可以查看以下链接了解更多详情 here

【讨论】：

【参考方案2】：

这个问题很老，但在谷歌搜索中首先出现，所以我想，我会回答。我有一个非常相似的问题，以为我会发疯，但偶然发现了这个页面：https://tesseract-ocr.github.io/tessdoc/ImproveQuality

上面写着：反转图像虽然 tesseract 版本 3.05（及更早版本）处理倒置图像（深色背景和浅色文本）没有问题，但对于 4.x 版本，使用浅色背景上的深色文本。

我用 ImageMagick 否定了图像，然后我们开始：100% 匹配！

【讨论】：

以上是关于提高屏幕截图上的 Tesseract OCR 准确性的主要内容，如果未能解决你的问题，请参考以下文章