在 iPhone 上使用 tesseract/opencv 识别 CMC7
Posted
技术标签:
【中文标题】在 iPhone 上使用 tesseract/opencv 识别 CMC7【英文标题】:CMC7 recognition with tesseract/opencv on iPhone 【发布时间】:2013-02-11 19:27:11 【问题描述】:我目前正在 ios 上做一个项目。我正在开发的应用程序应该从支票(支票?)中拍照,并读取写在支票底部的 CMC7 号码。
目前,我正在使用 openCV 进行这项工作,因为之前在我到达之前对该项目所做的工作,但是:
openCV 比 Tesseract 更适合这种工作吗?
这里的困难在于使用的字体,就是这个: http://www.dafont.com/fr/cmc7.font 可以想象,通常的 OCR 无法识别这种字体,因为它的形状。我认为完成这项工作的最佳方法是使用字体的条形码来识别它,而不是使用字符的形状。
我的想法是,据我所知,Tesseract 可以识别不同种类的字体,我们可以将它训练成特定的字体,但是用于 CMC7 的这种字体呢? 如果我想处理条形码,有没有办法用 Tesseract 来做,还是不能只用于字体识别?
【问题讨论】:
【参考方案1】:我们有同样的问题。我认为不可能以条形码方式从 cmc7 获取功能。因为您在数字占位符内有不同的笔划高度和位置。我不熟悉 Tesseract,但对于所有类型的相关器,您可以选择强烈定义类别的特征,类别中样本之间的差异很小。我们正在考虑使用 LBP、HOG 或特征向量等尺度不变特征来消除插值后的数据丢失。
【讨论】:
实际上,我设法开发了一种能够使用 OpenCV 读取条形码的算法,所以是的,这是可能的,但并不容易。 如果您能分享主要思想,我将不胜感激。 抱歉,好久没来了。主要思想是我不认为CMC7警察是警察,而是条形码。我的意思是,我需要开发一种能够区分黑线和白背景的算法。为此,我们需要一张干净的照片,其中包含很多细节。您将照片转为背面和白色,然后通过计算每行/列上黑色像素的中间值来清除干扰。一旦干净(这是这里的主要问题),您可以很容易地将数字与其他数字分开,然后读取条形码。以上是关于在 iPhone 上使用 tesseract/opencv 识别 CMC7的主要内容,如果未能解决你的问题,请参考以下文章
无法使用 JavaScript 在 iPhone 上播放声音,但可以在 Android 上播放
在 iPhone 上使用 UISplitViewController 时如何实现推送导航?
苹果 mapkit 在中国可以在 iPhone 设备上使用吗
无法在 iphone 3G 上使用 AVAssetWriter 从 UIImage 数组制作电影