Tesseract OCR:如何找到每个返回字符的读取错误大小?

Posted

技术标签:

【中文标题】Tesseract OCR:如何找到每个返回字符的读取错误大小?【英文标题】:Tesseract OCR: How to find the read-error-magnitude of each returned character? 【发布时间】:2011-10-26 23:52:16 【问题描述】:

我在 iPhone 应用程序中使用 Tesseract OCR 引擎从账单发票照片中读取特定的数字字段。 使用了大量的照片预处理(自适应阈值、伪影清理等),结果最终相当准确,但仍有一些情况我想改进。

如果用户在弱光条件下拍摄照片并且照片中有一些噪点或伪影,OCR 引擎会将这些伪影解释为额外的数字。在某些背面情况下,它可以读取例如“32,15”欧元的数字金额为“5432,15”欧元,这完全不利于最终用户对产品的信心。

我假设,如果每个读取的字符都存在内部 OCR 引擎读取错误,那么在我之前示例的“54”位上,它会更高,因为它们在小噪声像素上被识别,如果我可以访问此读取错误值,我将能够轻松丢弃错误的数字。

您是否知道任何方法可以获取从 tesseract OCR 引擎返回的每个单独字符的读取误差幅度(或任何“准确度因子”值)?

【问题讨论】:

【参考方案1】:

在 Tesseract 术语中称为“信心”值。在 tesseract-ocr Group 中搜索该术语会出现许多提到 TesserractExtractResult 方法的答案。

hOCR output 也包含此值。

【讨论】:

谢谢!我会检查信心选项;-)

以上是关于Tesseract OCR:如何找到每个返回字符的读取错误大小?的主要内容,如果未能解决你的问题,请参考以下文章

是否可以使用 Tesseract OCR 识别 iPhone 屏幕上绘制的字符?

当您执行更多 OCR 时,Tesseract 似乎正在学习字符,如何在使用之间保存学习数据?

tesseract-ocr 如何包含 baseapi.h

如何在windows上编译Tesseract OCR

光学字符识别。使用tesseract识别里程表

Tesseract 或任何其他 OCR 库