如何在 Windows 上训练 Tesseract

Posted

技术标签:

【中文标题】如何在 Windows 上训练 Tesseract【英文标题】:How can I train Tesseract on Windows 【发布时间】:2013-10-09 08:07:55 【问题描述】:

我正在尝试训练 tesseract 在 Windows 上工作。这个过程完成得很好,但是当我打电话给

tesseract.exe file.tiff out 

运行后,文件为空。

我不知道这里发生了什么,我在 linux 下做了同样的过程并且完美地工作。

我认为问题可能出在 mftraining.exe 的生成上。 它抛出这个消息:

Warning: no protos/configs for a in CreateIntTemplates()
Warning: no protos/configs for f in CreateIntTemplates()
Warning: no protos/configs for l in CreateIntTemplates()
Warning: no protos/configs for o in CreateIntTemplates() 
Warning: no protos/configs for r in CreateIntTemplates()
Error: no configs for class a in mftraining
Error: no configs for class f in mftraining
Error: no configs for class l in mftraining
Error: no configs for class o in mftraining
Error: no configs for class r in mftraining

任何其他端都没有问题

有人可以帮帮我吗?

【问题讨论】:

【参考方案1】:

你有没有尝试按照谷歌的这个手册来学习如何训练 tesseract ?

https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

【讨论】:

是的,我按照这些步骤进行操作,并且使用 linux 进行了很好的训练,但在 windows 环境中无法正常工作。谢谢 在您写下答案后的 4 年多时间里,该链接已失效。你有更新的链接吗?【参考方案2】:

我知道这个问题已经过时了,但是如果您正在寻找一种方法来在 Windows 上训练当前版本的 Tesseract (4+),我已经创建了一个可以自动化所有过程的 GUI。它需要 Python 3。Here 是我的 GitHub 存储库,其中包含所有源代码和编译后的可移植可执行文件。

【讨论】:

【参考方案3】:

根据here:

    Windows 不支持训练。 如果您想测试/修复某些内容,请使用存储库中的当前代码(应该可以在 Windows 上使用 msys2 构建它)

培训工具仅包含在Tesseract 3.03+ 中。单独的命令用于构建主程序tesseract.exe 和培训工具。如下图。

我已经用 MSYS2 在 Windows 7 上成功构建了主程序。但我未能构建训练工具。

更新

现在我转而使用 Xubuntu 来构建主程序和培训工具。并且可以进行训练过程。虽然有很多细节需要调整。

【讨论】:

以上是关于如何在 Windows 上训练 Tesseract的主要内容,如果未能解决你的问题,请参考以下文章

Windows下Tesseract训练音符识别

Windows下Tesseract训练音符识别

Windows下Tesseract训练音符识别

tesseract系列 -- tesseract训练

如何训练 tesseract 识别低 DPI 下的小数字?

如何在windows上编译Tesseract OCR