Google Cloud Vision OCR 遗漏了单个数字和符号
Posted
技术标签:
【中文标题】Google Cloud Vision OCR 遗漏了单个数字和符号【英文标题】:Google Cloud Vision OCR misses single numbers and symbols 【发布时间】:2017-05-20 04:43:51 【问题描述】:我正在使用 Google Cloud Vision API 来检测收据中的文本。在某些情况下,不会检测到收据上的所有文本。主要是短数字、符号和单词没有被检测到。
这个问题的一个例子可以在here找到,它是一个用“Try the API”接口处理的荷兰收据。如图所示,并非所有文本都被检测到。
图片符合文档中设置的最佳实践指南。
有没有办法改进图像或配置 API 以便检测到所有文本和符号?非常感谢任何提示或帮助。
【问题讨论】:
【参考方案1】:这是 google OCR 的缺点之一 - 它经常遗漏单个字符和符号。如果您使用检测模式“TEXT_DETECTION”而不是“DOCUMENT_TEXT_DETECTION”,您可能会得到更多的单个字母和符号。但不能保证检测到所有单个字母。
顺便说一句:ABBYY 云 OCR-API 在这方面做得更好 - 但要贵得多。
【讨论】:
这根本不是我的经验。我觉得 Azure 的检测效果最好,但我还没有尝试过亚马逊的产品。以上是关于Google Cloud Vision OCR 遗漏了单个数字和符号的主要内容,如果未能解决你的问题,请参考以下文章
Google Cloud Vision OCR 错误代码 7 - 权限被拒绝
使用 Google Cloud Vision 的 OCR PDF 文件?
KeyError:使用 Google Cloud Vision API 进行 OCR 时出现“textAnnotations”
Google Cloud Vision OCR 遗漏了单个数字和符号
将 Google Cloud Vision OCR X 和 Y 坐标转换为 bbox 坐标
google vision - 在 c# 中从 google.cloud.vision.v1.entity 注释转换为 json