用于英文手写文本的 Tesseract 4.0

Posted

技术标签:

【中文标题】用于英文手写文本的 Tesseract 4.0【英文标题】:Tesseract 4.0 for English handwritten text 【发布时间】:2017-05-18 18:15:13 【问题描述】:

我想知道有没有人尝试过 tesseract 4.0 版(我猜仍然是 alpha 版)手写文本。

从我从它的文档中读到的内容来看,它现在正在使用 LSTM,并声称可以产生更好的结果。

我在想是否值得为手写文本训练 tesseract(因为它现在实现了 LSTM),或者其他任何有训练 tesseract 经验的人。

【问题讨论】:

【参考方案1】:

Tesseract 4.0 (alpha) 无法正常处理手写文本。它仅适用于打印文本,但 LSTM ML 模型比 Tesseract 3.x 提供更好的准确性,如果您比较两个版本的输出,您会得到很大的改进结果。

【讨论】:

以上是关于用于英文手写文本的 Tesseract 4.0的主要内容,如果未能解决你的问题,请参考以下文章

用于从我们上传的图像中读取任何文本的 PHP api

使用 4.0 版的 Swift 3.0 项目中的 Tesseract 训练数据不工作

pytesseract 仅使用 tesseract 4.0 数字不起作用

Tesseract 无法识别德语“für”

Tesseract-OCR-03-图片文字识别

训练手写数字的Tesseract:mftraining步骤需要永远