如何在 iOS 中使用 Tesseract OCR 库从图像中识别准确的文本?

Posted

技术标签:

【中文标题】如何在 iOS 中使用 Tesseract OCR 库从图像中识别准确的文本?【英文标题】:How to recognise the accurate text from an image using Tesseract OCR Library in iOS? 【发布时间】:2016-10-09 17:16:29 【问题描述】:

我正在 Objective C 中创建一个 iPhone 应用程序。我正在尝试从图像(从相机拍摄)中识别文本。为此,我在我的应用程序 Tesseract OCR Library 中使用。它对某些文本工作正常,但无法从捕获的图像中获得准确的结果。还有来自 Google 代码的最新 tessdata 文件。

我从this link 添加了tesseract 库。

下面是我尝试识别的图像:

我的代码如下:

    G8Tesseract *tesseract = [[G8Tesseract alloc] initWithLanguage:@"eng+fra" engineMode:G8OCREngineModeTesseractCubeCombined];
    [tesseract setVariableValue:@"0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ:;,.!-()#&÷" forKey:@"tessedit_char_whitelist"];
    tesseract.pageSegmentationMode = G8PageSegmentationModeAuto;
    tesseract.maximumRecognitionTime = 60.0;
    tesseract.image = [selectedImage g8_blackAndWhite];
    [tesseract recognize];

    NSLog(@"%@", [tesseract recognizedText]);

但我得到这样的结果:

BAZAAR

mm; l Savees l smmamm l mm; l Accessories

commemw Street ' _ . «mm. me o snwapnagay

www minabazaav.cum

我已经通过这个链接浏览了:

How do I get accurate text using Tesseract OCR in ios? Why Tesseract OCR library (iOS) cannot recognize text at all? http://www.scriptscoop2.com/t/42247286510f/c-3.5-why-i-am-not-able-to-recognize-text-in-image-using-tesseract.html

有没有人遇到同样的问题?

【问题讨论】:

【参考方案1】:

就我而言,Tesseract 库大部分时间都不准确。相反Abby 还可以。但是艾比没有离线

Abby *** Channel

【讨论】:

非常感谢@iDev 的回复,我使用 ABBYY 从捕获的图像中获得了准确的文本。您能否建议我是否可以使用此功能将每个文本与姓名、地址、电子邮件、电话号码等分开? http://cloud.ocrsdk.com/processBusinessCard 使用此 api,您将获得您期望的单独值 这是正确的看看这个ocrsdk.com/documentation/apireference/processBusinessCard 再次感谢您的宝贵时间..!

以上是关于如何在 iOS 中使用 Tesseract OCR 库从图像中识别准确的文本?的主要内容,如果未能解决你的问题,请参考以下文章

为啥 Tesseract OCR 库(iOS)根本无法识别文本?

如何使用 tesseract 对文档中的多个列进行 OCR

iPhone iso的Tesseract限制?适用于 ios 的任何其他 OCR 引擎

iOS Tesseract OCR 图像准备

如何通过Tesseract开源OCR引擎创建Android OCR应用

如何通过Tesseract开源OCR引擎创建Android OCR应用