ABBYY OCR SDK:我正在尝试识别名片但没有得到任何输出的示例脚本

Posted

技术标签:

【中文标题】ABBYY OCR SDK:我正在尝试识别名片但没有得到任何输出的示例脚本【英文标题】:ABBYY OCR SDK: I am trying a sample script for recognizing business cards but not getting any output 【发布时间】:2012-04-17 01:17:39 【问题描述】:

我正在尝试使用 ABBYY.com 的 php 中的 OCR SDK 来识别名片。我有以下代码只是为了检查它是如何工作的。当我执行代码时,我得到一个空白输出。我在哪里可能会在代码上出错?

$applicationId = "MyBusinessCardReader"; $password = "密码"; $filename = "businesscard.jpg"; $localDir = 目录名(__FILE__); $url = "http://cloud.ocrsdk.com/processBusinessCard"; $c = curl_init(); curl_setopt($c, CURLOPT_URL, $url); curl_setopt($c, CURLOPT_RETURNTRANSFER, 1); curl_setopt($c, CURLOPT_USERPWD, "$applicationId:$password"); curl_setopt($c, CURLOPT_POST, 1); $post_array = 数组( "my_file" => "@$localDir$filename" ); curl_setopt($c, CURLOPT_POSTFIELDS, $post_array); $response = curl_exec($c); curl_close($c); 回声“
”;
回声$响应;
回声“&lt/pre>”;

可以在http://test.goje87.com/vangal/businesscard.jpg查看示例名片图片

【问题讨论】:

【参考方案1】:

我对 Abbyy SDK 了解不多。但在您尝试任何图像上的 OCR 引擎之前,您应该始终确保...

...用不同的颜色裁剪所有边框, ...缩放图像,使文本达到每 300 DPI 至少 10 pt 的(虚拟)大小。

我针对您的原始样本尝试了 Tesseract v3.01,但没有找到任何东西。

然后我应用 ImageMagick 命令来裁剪边框并将图像缩放到 200%,如下所示:

convert                 \
    businesscard.jpg    \
   -crop 440x200+30+120 \
   -scale 180%          \
    cropped+scaled-businesscard.jpg

获取这张图片:

这已经让 Tesseract 的命令行能够识别大部分文本(在 @. 上失败):

tesseract b.jpg bcard && cat bcard.txt

  Tesseract Open Source OCR Engine v3.01 with Leptonica

    Fe/<70"
    MIKE FARAG
    PH 913 284 6455
    EM milzeocreatefervoncom
    Tw 0mil<efarag01
    createfervoncom

如果我愿意的话,Tesseract 的识别率很可能接近 100%……

...为 OCR 目的增强图片质量:增加对比度并转换为纯灰度(“二值化”); ...'train' 对本文档中使用的特定字体进行 Tesseract。

我认为您可以通过类似措施让 Abbyy 的生活更轻松...

【讨论】:

以上是关于ABBYY OCR SDK:我正在尝试识别名片但没有得到任何输出的示例脚本的主要内容,如果未能解决你的问题,请参考以下文章

免费或负担得起的 OCR 和 ICR(手写识别)SDK? [关闭]

移动端名片识别-ocr识别

名片识别sdk助力于商务交流活动

Android名片扫描识别系统SDK

我如何在 ABBYY ios sdk 中配置手写识别

ABBYY 云 OCR