Tesseract 或任何其他 OCR 库

Posted

技术标签:

【中文标题】Tesseract 或任何其他 OCR 库【英文标题】:Tesseract or any other OCR lib 【发布时间】:2011-05-17 21:01:54 【问题描述】:

我正在寻找有关如何在 C++ 中使用(和训练?)Tesseract 的解释/API 文档/示例,在 google Tesseract 页面上没有任何用处,但在网络上还没有找到。

欢迎任何有用的资源和经验,因为我不知道如何开始。

附注:

    我愿意接受其他方面的建议 图书馆。 仅免费

【问题讨论】:

【参考方案1】:

我对 Tesseract 有一些经验... 一个简单的“training tesseract”谷歌显示了这个页面: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract 您必须在其中选择要训练的 tesseract 版本。 虽然 3 是最新版本,但它是全新的,因此人们仍在解决任何问题 - 我仍在使用 2.4 版本。无论如何,您会看到针对特定“语言”(或者应该称为“字体”或“字符集”)训练 tesseract 大约需要 9 个步骤。您也可以只使用现有的“eng”语言——但这取决于您的应用程序。例如,在我的应用程序中,我必须进行文档分析并获取特定区域并想要 OCR 一个 13 个字符的数字字符串 - 我需要高精度 - 我不希望它读取 '5' 作为' S' 和 '0' 为 'O' 等,因此创建仅包含字符 0..9 的特定字体集的特定“语言”是合乎逻辑的,而您可能不在乎是否得到额外的“噪音”

【讨论】:

【参考方案2】:

Tesseract Ocr 是一个用于检测光学字符的开源库。如果您使用的是 Visual Studio,则只需包含库文件。如果您使用的是 qt creator,那么您必须构建库才能在 QT 上工作。您需要使用 CMakelist 或 Cmake Gui 来构建库。 你可以访问链接 Opencv Ocr build for Qt 5.4 mingw

【讨论】:

以上是关于Tesseract 或任何其他 OCR 库的主要内容,如果未能解决你的问题,请参考以下文章

Windows 中的 Tesseract OCR Android

android怎么调用tesseract实现OCR功能?

python使用tesseract-ocr完成验证码识别

python使用tesseract-ocr完成验证码识别

python使用tesseract-ocr完成验证码识别

Tess-Two(Android 中的 Tesseract OCR)显示非常不准确的结果