Tesseract OCR：如何找到每个返回字符的读取错误大小？

Posted 2023-04-17

技术标签:

【中文标题】Tesseract OCR：如何找到每个返回字符的读取错误大小？【英文标题】：Tesseract OCR: How to find the read-error-magnitude of each returned character? 【发布时间】：2011-10-26 23:52:16 【问题描述】：

我在 iPhone 应用程序中使用 Tesseract OCR 引擎从账单发票照片中读取特定的数字字段。使用了大量的照片预处理（自适应阈值、伪影清理等），结果最终相当准确，但仍有一些情况我想改进。

如果用户在弱光条件下拍摄照片并且照片中有一些噪点或伪影，OCR 引擎会将这些伪影解释为额外的数字。在某些背面情况下，它可以读取例如“32,15”欧元的数字金额为“5432,15”欧元，这完全不利于最终用户对产品的信心。

我假设，如果每个读取的字符都存在内部 OCR 引擎读取错误，那么在我之前示例的“54”位上，它会更高，因为它们在小噪声像素上被识别，如果我可以访问此读取错误值，我将能够轻松丢弃错误的数字。

您是否知道任何方法可以获取从 tesseract OCR 引擎返回的每个单独字符的读取误差幅度（或任何“准确度因子”值）？

【问题讨论】：

【参考方案1】：

在 Tesseract 术语中称为“信心”值。在 tesseract-ocr Group 中搜索该术语会出现许多提到 TesserractExtractResult 方法的答案。

hOCR output 也包含此值。

【讨论】：

谢谢！我会检查信心选项;-)

以上是关于Tesseract OCR：如何找到每个返回字符的读取错误大小？的主要内容，如果未能解决你的问题，请参考以下文章

是否可以使用 Tesseract OCR 识别 iPhone 屏幕上绘制的字符？

tesseract-ocr 如何包含 baseapi.h

如何在windows上编译Tesseract OCR

光学字符识别。使用tesseract识别里程表

Tesseract 或任何其他 OCR 库