实时图像处理(OCR)[关闭]

Posted

技术标签:

【中文标题】实时图像处理(OCR)[关闭]【英文标题】:Real TIme Image Processing (OCR) [closed] 【发布时间】:2013-03-17 09:14:56 【问题描述】:

我正计划开发像Word Lens 这样的应用程序。有人可以推荐一个我可以使用的好图书馆吗?或任何人解释 Word Lens 应用程序背后的技术?是卷轴时间图像匹配还是 OCR?我知道一些图像处理库,如 OpenCv、tesseract...非常感谢您的帮助...

【问题讨论】:

【参考方案1】:

我是 Word Lens 的创建者之一。虽然有一些 OCR 库(如 tesseract),但我们决定自己制作,以获得更好的结果和性能。我们的一般算法是这样的:

    从相机复制图像并获取其灰度分量 平整图像,使文本在背景中清晰突出 在看起来像字符和句子的事物周围画框 进行 OCR:将每个框中的像素与字符数据库进行匹配——这实际上非常困难! 将字符收集成单词,查字典(这也很难,因为OCR会出错) 将结果重新绘制到图像上

图像匹配本身不够好,因为字体、单词和语言种类繁多。

OpenCV 是一个很好的库,可以启动和运行,并且可以了解更多关于计算机视觉的一般知识。我建议建立他们的例子,并在那里玩。玩得开心!

【讨论】:

以某种方式结合 4 和 5 会得到更好的结果吗?作为 OCR 的局外人,在我看来,您丢失了“5”的信息,这在困难的情况下可能有用。 马丁:完全正确;例如,“O”与“0”非常相似,甚至与“8”和“B”非常相似,因此它有助于保留可能性列表,然后在有更多消歧信息可用时在以下阶段将其缩减(一种简单的反馈) @jd。感谢您的评论.. 我可以知道您创建 Word Lens 需要多长时间吗?你能推荐一些好的 OCR 教程吗? Word Lens 花了两个人大约两年的时间(大约)制作。除了建议您构建原型之外,我想不出很多好的教程。如果您可以让基本系统快速运行,那么当您进行更多研究时,您将准备好提出正确的问题。 @jd。谢谢..我会在构建原型后回来...请您通过 gmail 连接我吗?我的 id 是 2arshu@gmail.com?

以上是关于实时图像处理(OCR)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

Android中的OCR(图像到文本)[关闭]

如何使用文本图像开发 ocr 应用程序 [关闭]

PHP/jQuery/JavaScript 中的免费 OCR 处理 API [关闭]

如何制作 OCR 程序? [关闭]

如何设置图像大小以改善 OCR 输出。?

包含免费 OCR 基准测试集的资源 [关闭]