整体单词识别算法详解

Posted 2023-04-17

技术标签:

【中文标题】整体单词识别算法详解【英文标题】：Holistic Word Recognition algorithm in detail 【发布时间】：2011-05-29 01:05:00 【问题描述】：

在哪里可以找到整体单词识别的算法详细信息？我需要用硬件（实际上是 FPGA）构建一个简单的 OCR 系统，而科学期刊似乎如此抽象？

是否有任何用于整体单词识别的开源（开放核心）代码？

谢谢

【问题讨论】：

@Joe Blow：FPGA 是现场可编程门阵列。它们只是可由用户配置的集成电路。 @Joe：现场可编程门阵列是“可编程硬件”——它是一个带有一堆逻辑门（AND、OR 等）的设备，你可以通过编程方式“连接”但是你想要（有点像上传固件），使用，然后“重新连接”其他东西。 @Joe 你在接受谚语吗？ @Joe：我不知道，但这本身就是一个很好的 SO 问题。 【参考方案1】：

对于非常适合 FPGA 实现（令人尴尬的并行）的算法，您可以查看：

http://en.wikipedia.org/wiki/Cross-correlation

它速度快，易于实现。

唯一的事情是：它识别形状（在您的情况下是一些文本）取决于旋转和大小/拉伸/倾斜等。但是如果这不是问题，它可以非常快并且非常健壮。您应该只注意相似字符（如 o 和 c）的解释问题。

我用它来查找扫描表单上的默认文本以获取感兴趣区域所在的方位，并且在这些图像（600 万像素）中进行搜索仅花费了大约 15 毫秒，而我们在单线程中的 Core2 CPU 上实现。

【讨论】：

我们实现了来自：scribblethink.org/Work/nvisionInterface/nip.html 的公式，并使用类似 mipmap / 图像金字塔的方案来确保 FLOP 的数量保持在较低水平

以上是关于整体单词识别算法详解的主要内容，如果未能解决你的问题，请参考以下文章

Fast算法原理：fastica算法步骤详解