是否有任何可以针对新符号进行训练的 OCR？

Posted 2023-04-17

技术标签:

【中文标题】是否有任何可以针对新符号进行训练的 OCR？【英文标题】：Is there any OCR that can be trained for new symbols? 【发布时间】：2011-09-05 10:31:55 【问题描述】：

是否有可用的免费/开源OCR，可用于新符号，也可以输出目标图像中发现的符号的坐标？我读过 tesseract OCR 可以训练，但它可以在 OCR 之后给我坐标吗？有什么例子吗？我需要代码/步骤来使用包含一个 sybmol 的图像训练 ocr。一张图像中大约有 20 个符号要训练。然后使用经过训练的 OCR 检测目标图像中的这些符号，如果找到，则也给出坐标。

【问题讨论】：

【参考方案1】：

您可以训练 Tesseract 识别新符号。 hocr 格式包含已识别单词的坐标。

https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract

http://vietocr.sourceforge.net/training.html

https://github.com/tesseract-ocr/tesseract/wiki/Command-Line-Usage#hocr-output

【讨论】：

你有更多的细节吗？链接是旧的/死的。

以上是关于是否有任何可以针对新符号进行训练的 OCR？的主要内容，如果未能解决你的问题，请参考以下文章

jTessBoxEditor训练识别库

对符号/图像进行分类的建议

利用jTessBoxEditor工具进行Tesseract3.02.02样本训练，提高验证码识别率

RPA训练营第四期-内网验证码识别

R（插入符号）-在循环中训练“mlpML”模型时出错

是否可以在没有任何训练的情况下使用 Caffe Only 进行分类？