iPhone 上的数字识别是不是可以实时进行?

Posted

技术标签:

【中文标题】iPhone 上的数字识别是不是可以实时进行?【英文标题】:Is number recognition on iPhone possible in real-time?iPhone 上的数字识别是否可以实时进行? 【发布时间】:2011-06-20 17:08:24 【问题描述】:

我需要从 iPhone 上的摄像头图像中实时识别数字。我知道图片上的数字不会超过 5 位。

考虑到 iPhone 的计算规格,解决这个问题是否现实? 有没有人有使用 Tesseract OCR 库的经验,你认为使用它可以解决吗?

【问题讨论】:

可能重复:***.com/questions/3140455/… @Daniel:虽然这个问题询问如何使用 Tesseract 读取任何静止图像中的数字,但这是在研究从实时视频流中进行这种处理的可能性。我相信这里的差异足以证明一个新问题的合理性。 【参考方案1】:

这取决于您对“实时”的定义,但是是的,应该可以在 iPhone 4 上对数字 0-9 进行相对快速的识别,特别是如果您可以识别字体、照明条件等。他们将出现在其中。

我强烈建议使用 iPhone 相机阅读how Sudoku Grab does its recognition of puzzles 上的文章。在他们的案例中,使用经过训练的神经网络来识别数字,这在现代 ios 硬件上应该相当简单和快速。

目前的识别库,如 OpenCV,将使用 iPhone 的 CPU 进行处理。我听说他们可以以足够快的速度完成更复杂的任务,例如面部识别,以与视频源一起使用,同时显示出最少的口吃。

为了获得更好的性能,我相信新款 iOS 设备上的可编程 GPU 具有很大潜力。在my benchmarks 中,我看到使用 iPhone 4 的 GPU 进行简单的图像处理时速度提高了 14 到 28 倍。虽然现在很少有人关注这个问题,但像 Sudoku Grab 的神经网络这样的东西应该是一个足够并行的过程,可以从在 GPU 上运行中受益。

【讨论】:

【参考方案2】:

它应该在计算上是可能的。有可以实时获取条形码的应用程序,也有可以进行实时翻译的应用程序。 (字镜头)。不过,我不确定他们使用什么库。

【讨论】:

【参考方案3】:

是的,可以使用 tesseract 引擎

如果您想检查,这里是示例代码...

https://github.com/nolanbrown/Tesseract-iPhone-Demo

【讨论】:

【参考方案4】:

有免费的 SDK:http://rtrsdk.com/ 同时支持 iOS 和 Andorid,实时工作,帮助您捕获任何文本,数字应该不是问题。

免责声明:我为 ABBYY 工作

【讨论】:

【参考方案5】:

是的。 Bender 可以帮助你。它可以让你在 iOS 上构建和运行神经网络。由于它在引擎盖下使用金属,因此运行快速且平稳。它还支持直接运行 TensorFlow 模型。

因此,如果您需要帮助,您可以在 Bender 中运行 TensorFlow 中的现有模型以进行数字识别Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras 进行数字识别

免责声明:我参与了这个项目。

【讨论】:

以上是关于iPhone 上的数字识别是不是可以实时进行?的主要内容,如果未能解决你的问题,请参考以下文章

iPhone 上的实时音高转换

使用 iPhone 摄像头识别特定位置的文本

使用 echoprint 对整个 iPhone 音乐库进行指纹识别

如何实时收听麦克风输入并进行分析?

iPhone 上的实时录音/分析

禁用iPhone 4S /新iPad键盘上的听写按钮