有人可以成功地对该图像执行 OCR 吗?

Posted

技术标签:

【中文标题】有人可以成功地对该图像执行 OCR 吗?【英文标题】:Could some one perform an OCR on this image successfully? 【发布时间】:2013-06-20 08:18:26 【问题描述】:

我尝试使用从网上下载的一些演示来测试此图像上的 OCR,图像上的字符格式不正确,因为您可以在输入 TextBox 时看到打印字符。我对 OCR 和神经网络的经验不够。这些是我的图片https://sites.google.com/site/thecabinet3/home/files-store/sample.bmp?attredirects=0 和 https://sites.google.com/site/thecabinet3/home/files-store/6bi.bmp?attredirects=0

我有一些问题:

    我是否必须使用这些新的非标准字符重新训练神经网络,网络已经使用标准字符集进行了训练。 (我的意思是标准字符看起来就像您在 TextBox 中输入任何具有指定字体的字符时看到的字符)。 您能否使用一些示例对我成功上传的图像执行 OCR?如果可以,请给我这个工作示例?

非常感谢您的帮助!

【问题讨论】:

【参考方案1】:

我在商业高质量网络服务 OCR 中测试了您的图像,并收到了 100% 开箱即用的识别结果。 65-HC 0999

我查看了您的示例,根据我的经验,它具有足够的质量和字符定义,可以在任何下降 OCR 系统中产生高质量的结果,除非您的算法对字符模式的粗糙边缘非常敏感。

我不确定您的需求是学术需求还是商业需求。上次我使用神经网络进行 OCR 是在很多年前的大学里,但由于训练限制,我没有在商业实施中使用。

【讨论】:

谢谢,我的需求只是学术性的,我尝试过一些开源库,例如 Tesseract、vietocr,但它们无法识别字符。我也尝试过使用 Accord.NET,如果我提供足够多的训练数据,它似乎可以正常工作。我认为您建议的网络服务具有足够高的质量来识别我图像中的字符。但是我只是喜欢免费的东西。

以上是关于有人可以成功地对该图像执行 OCR 吗?的主要内容,如果未能解决你的问题,请参考以下文章

实时图像处理(OCR)[关闭]

tesseract 在同一图像上的不同结果

OCR无法识别Steam键(Dot Matrix OCR)

Pytesseract OCR 边界框

将图像类型 PDF 转换为启用 OCR 的 PDF

计算 UIImage 的“亮度”的好方法?