名片解析器。如何从名片识别文本中提取相关信息?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了名片解析器。如何从名片识别文本中提取相关信息?相关的知识,希望对你有一定的参考价值。

我开发了具有OCR扫描功能的iphone应用程序。使用Tesseract api,从拍摄的图像中获取文本。但现在我需要将每个文本与名称,地址,电子邮件,电话号码等分开。因为名片结构/格式不具体,所以难以假设。

然而,很少有事情假设1)包含字符串的“@”主要是电子邮件ID。 2)所有带括号或+号的数字大多数都是电话号码..但仍然有很多可能性。

答案

您将需要NSLInguisticTagger类的帮助。这是您最好的选择,否则您将必须为每个部分创建类似的逻辑,如上所述。

另一答案

您可以检查我们在此javascript BCR库中使用的逻辑,也基于tesseract(js中的移植)。

https://github.com/syneo-tools-gmbh/Javascript-BCR-Library

以上是关于名片解析器。如何从名片识别文本中提取相关信息?的主要内容,如果未能解决你的问题,请参考以下文章

很实用的h5实现名片扫描识功能快速结合市场运营

json解析

名片识别sdk助力于商务交流活动

名片扫一扫识别怎么样

创建出色的解析器 - 从 HTML/博客中提取相关文本

安卓/iOS手机端名片识别sdk