如何提高tesseract的OCR结果

Posted

技术标签:

【中文标题】如何提高tesseract的OCR结果【英文标题】:How to improve OCR results of tesseract 【发布时间】:2016-06-02 05:40:03 【问题描述】:

我在使用 tesseract 进行数字 OCR 时遇到问题。这张图

被识别为

‘我 .38)

我使用 -psm 6 作为参数。有没有更好的方法来识别数字?我需要配置 tesseract 还是需要对图像进行任何额外的预处理?

【问题讨论】:

【参考方案1】:

我重新缩放到 300DPI 并得到了正确的结果。

【讨论】:

通常是否推荐重新缩放? 低分辨率的屏幕截图通常需要它。 github.com/tesseract-ocr/tesseract/wiki/…

以上是关于如何提高tesseract的OCR结果的主要内容,如果未能解决你的问题,请参考以下文章

提高多段落扫描的 OCR 性能

正方体 3 (OCR) - .NET 包装器

Tesseract+opencv+VS+win实现OCR

我可以在 Windows 命令行中测试 tesseract ocr 吗?

Python tesseract 提高了 OCR 的准确性

如何提高Tesseract-OCR的识别精度