整体单词识别算法详解

Posted

技术标签:

【中文标题】整体单词识别算法详解【英文标题】:Holistic Word Recognition algorithm in detail 【发布时间】:2011-05-29 01:05:00 【问题描述】:

在哪里可以找到整体单词识别的算法详细信息?我需要用硬件(实际上是 FPGA)构建一个简单的 OCR 系统,而科学期刊似乎如此抽象?

是否有任何用于整体单词识别的开源(开放核心)代码?

谢谢

【问题讨论】:

@Joe Blow:FPGA 是现场可编程门阵列。它们只是可由用户配置的集成电路。 @Joe:现场可编程门阵列是“可编程硬件”——它是一个带有一堆逻辑门(AND、OR 等)的设备,你可以通过编程方式“连接”但是你想要(有点像上传固件),使用,然后“重新连接”其他东西。 @Joe 你在接受谚语吗? @Joe:我不知道,但这本身就是一个很好的 SO 问题。 【参考方案1】:

对于非常适合 FPGA 实现(令人尴尬的并行)的算法,您可以查看:

http://en.wikipedia.org/wiki/Cross-correlation

它速度快,易于实现。

唯一的事情是:它识别形状(在您的情况下是一些文本)取决于旋转和大小/拉伸/倾斜等。但是如果这不是问题,它可以非常快并且非常健壮。您应该只注意相似字符(如 o 和 c)的解释问题。

我用它来查找扫描表单上的默认文本以获取感兴趣区域所在的方位,并且在这些图像(600 万像素)中进行搜索仅花费了大约 15 毫秒,而我们在单线程中的 Core2 CPU 上实现。

【讨论】:

我们实现了来自:scribblethink.org/Work/nvisionInterface/nip.html 的公式,并使用类似 mipmap / 图像金字塔的方案来确保 FLOP 的数量保持在较低水平

以上是关于整体单词识别算法详解的主要内容,如果未能解决你的问题,请参考以下文章

算法详解:贪心算法入门

一文详解贪心算法

图像识别—MobileNets算法详解

东南大学RM装甲板识别算法详解

贪心算法的C语言实现与运用详解

Fast算法原理:fastica算法步骤详解