名片解析器。如何从名片识别文本中提取相关信息?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了名片解析器。如何从名片识别文本中提取相关信息?相关的知识,希望对你有一定的参考价值。
我开发了具有OCR扫描功能的iphone应用程序。使用Tesseract api,从拍摄的图像中获取文本。但现在我需要将每个文本与名称,地址,电子邮件,电话号码等分开。因为名片结构/格式不具体,所以难以假设。
然而,很少有事情假设1)包含字符串的“@”主要是电子邮件ID。 2)所有带括号或+号的数字大多数都是电话号码..但仍然有很多可能性。
答案
您将需要NSLInguisticTagger类的帮助。这是您最好的选择,否则您将必须为每个部分创建类似的逻辑,如上所述。
另一答案
您可以检查我们在此javascript BCR库中使用的逻辑,也基于tesseract(js中的移植)。
https://github.com/syneo-tools-gmbh/Javascript-BCR-Library
以上是关于名片解析器。如何从名片识别文本中提取相关信息?的主要内容,如果未能解决你的问题,请参考以下文章