Google Cloud Vision OCR 遗漏了单个数字和符号

Posted

技术标签:

【中文标题】Google Cloud Vision OCR 遗漏了单个数字和符号【英文标题】:Google Cloud Vision OCR misses single numbers and symbols 【发布时间】:2017-05-20 04:43:51 【问题描述】:

我正在使用 Google Cloud Vision API 来检测收据中的文本。在某些情况下,不会检测到收据上的所有文本。主要是短数字、符号和单词没有被检测到。

这个问题的一个例子可以在here找到,它是一个用“Try the API”接口处理的荷兰收据。如图所示,并非所有文本都被检测到。

图片符合文档中设置的最佳实践指南。

有没有办法改进图像或配置 API 以便检测到所有文本和符号?非常感谢任何提示或帮助。

【问题讨论】:

【参考方案1】:

这是 google OCR 的缺点之一 - 它经常遗漏单个字符和符号。如果您使用检测模式“TEXT_DETECTION”而不是“DOCUMENT_TEXT_DETECTION”,您可能会得到更多的单个字母和符号。但不能保证检测到所有单个字母。

顺便说一句:ABBYY 云 OCR-API 在这方面做得更好 - 但要贵得多。

【讨论】:

这根本不是我的经验。我觉得 Azure 的检测效果最好,但我还没有尝试过亚马逊的产品。

以上是关于Google Cloud Vision OCR 遗漏了单个数字和符号的主要内容,如果未能解决你的问题,请参考以下文章

Google Cloud Vision OCR 错误代码 7 - 权限被拒绝

使用 Google Cloud Vision 的 OCR PDF 文件?

KeyError:使用 Google Cloud Vision API 进行 OCR 时出现“textAnnotations”

Google Cloud Vision OCR 遗漏了单个数字和符号

将 Google Cloud Vision OCR X 和 Y 坐标转换为 bbox 坐标

google vision - 在 c# 中从 google.cloud.vision.v1.entity 注释转换为 json