整体单词识别算法详解
Posted
技术标签:
【中文标题】整体单词识别算法详解【英文标题】:Holistic Word Recognition algorithm in detail 【发布时间】:2011-05-29 01:05:00 【问题描述】:在哪里可以找到整体单词识别的算法详细信息?我需要用硬件(实际上是 FPGA)构建一个简单的 OCR 系统,而科学期刊似乎如此抽象?
是否有任何用于整体单词识别的开源(开放核心)代码?
谢谢
【问题讨论】:
@Joe Blow:FPGA 是现场可编程门阵列。它们只是可由用户配置的集成电路。 @Joe:现场可编程门阵列是“可编程硬件”——它是一个带有一堆逻辑门(AND、OR 等)的设备,你可以通过编程方式“连接”但是你想要(有点像上传固件),使用,然后“重新连接”其他东西。 @Joe 你在接受谚语吗? @Joe:我不知道,但这本身就是一个很好的 SO 问题。 【参考方案1】:对于非常适合 FPGA 实现(令人尴尬的并行)的算法,您可以查看:
http://en.wikipedia.org/wiki/Cross-correlation
它速度快,易于实现。
唯一的事情是:它识别形状(在您的情况下是一些文本)取决于旋转和大小/拉伸/倾斜等。但是如果这不是问题,它可以非常快并且非常健壮。您应该只注意相似字符(如 o 和 c)的解释问题。
我用它来查找扫描表单上的默认文本以获取感兴趣区域所在的方位,并且在这些图像(600 万像素)中进行搜索仅花费了大约 15 毫秒,而我们在单线程中的 Core2 CPU 上实现。
【讨论】:
我们实现了来自:scribblethink.org/Work/nvisionInterface/nip.html 的公式,并使用类似 mipmap / 图像金字塔的方案来确保 FLOP 的数量保持在较低水平以上是关于整体单词识别算法详解的主要内容,如果未能解决你的问题,请参考以下文章