OCR Tesseract 只设置数字

Posted

技术标签:

【中文标题】OCR Tesseract 只设置数字【英文标题】:OCR Tesseract set up only numbers 【发布时间】:2013-02-06 05:00:57 【问题描述】:

我是一般编程的新手,最近开始接触应用程序开发。我正在为 ios 使用 tesseract,但我似乎无法弄清楚如何让它只读取数字。

Alex G Here 发布了一个确切的问题,我和他有相同的文件/问题。答案显然是

转到 tessdata\configs\digits 文件。如果您使用的是 API,那么 调用 SetVariable("tessedit_char_whitelist", "0123456789-.");你用 如果您想以编程方式调用 Tesseract,请使用 SetVariable API, 例如,通过 Objective-C。

除了我仍然不明白如何做到这一点。这个命令行在哪里?我从 Xcode 而不是命令行调用 Tesseract。我也不包含这个 tessdata\configs\digits 文件。

如果有人可以帮助我,我将不胜感激。

谢谢!

泰德

【问题讨论】:

【参考方案1】:

如果您关注How To: Compile and Use Tesseract (3.01) on iOS (SDK 5) 文章,您将在 Init 调用之后放置 SetVariable 语句,如下所示:

tesseract->Init([dataPath cStringUsingEncoding:NSUTF8StringEncoding], "eng");
tesseract->SetVariable("tessedit_char_whitelist", "0123456789-.");

【讨论】:

如果知道如何为数字生成 tessdata 以减少文件大小,那就太好了。

以上是关于OCR Tesseract 只设置数字的主要内容,如果未能解决你的问题,请参考以下文章

Tesseract+opencv+VS+win实现OCR

我可以在 Windows 命令行中测试 tesseract ocr 吗?

让 tesseract 只识别数字

正方体 3 (OCR) - .NET 包装器

Android Tesseract OCR 7 段数字

显式设置用于 Tesseract-OCR 识别的字体