是否有任何可以针对新符号进行训练的 OCR?

Posted

技术标签:

【中文标题】是否有任何可以针对新符号进行训练的 OCR?【英文标题】:Is there any OCR that can be trained for new symbols? 【发布时间】:2011-09-05 10:31:55 【问题描述】:

是否有可用的免费/开源OCR,可用于新符号,也可以输出目标图像中发现的符号的坐标?我读过 tesseract OCR 可以训练,但它可以在 OCR 之后给我坐标吗?有什么例子吗?我需要代码/步骤来使用包含一个 sybmol 的图像训练 ocr。一张图像中大约有 20 个符号要训练。然后使用经过训练的 OCR 检测目标图像中的这些符号,如果找到,则也给出坐标。

【问题讨论】:

【参考方案1】:

您可以训练 Tesseract 识别新符号。 hocr 格式包含已识别单词的坐标。

https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract

http://vietocr.sourceforge.net/training.html

https://github.com/tesseract-ocr/tesseract/wiki/Command-Line-Usage#hocr-output

【讨论】:

你有更多的细节吗?链接是旧的/死的。

以上是关于是否有任何可以针对新符号进行训练的 OCR?的主要内容,如果未能解决你的问题,请参考以下文章

jTessBoxEditor训练识别库

对符号/图像进行分类的建议

利用jTessBoxEditor工具进行Tesseract3.02.02样本训练,提高验证码识别率

RPA训练营第四期-内网验证码识别

R(插入符号)-在循环中训练“mlpML”模型时出错

是否可以在没有任何训练的情况下使用 Caffe Only 进行分类?