Google Vision 文本检测返回过多不必要的数据

Posted 2023-04-17

技术标签:

【中文标题】Google Vision 文本检测返回过多不必要的数据【英文标题】：Google Vision Text Detection returns too much unnecesary data 【发布时间】：2019-06-25 10:07:52 【问题描述】：

当使用 Google Vision 在菜单上运行文本检测时，来自其 API 的响应太大，并且返回了太多我不需要的数据。我只想要菜单中的文本，而不是响应附带的所有坐标。在我读过的任何文档中，我都找不到任何关于缩小响应范围的信息。有人知道如何指定响应中返回的字段吗？

这是我的要求：

POST: https://vision.googleapis.com/v1/images:annotate?key=<MY_KEY>

BODY:


  "requests": [
    
      "image": 
        "content": "...base64-encoded-image-content..."
      ,
      "features": [
        
          "type": "TEXT_DETECTION"
        
      ]
    
  ]

【问题讨论】：

仅解析 JSON 并提取 fullTextAnnotation 是否开销太大。文字出来的？这些 JSON 响应通常不会很大。您自己对这个问题的回答是我所知道的缩小响应中数据范围的唯一方法，但感觉很容易失败 - 这是他们 API 中未记录的部分，因此 Google 可以当场对其进行更改。这真的取决于你的用例，但我不会在发布版本中使用它。 @CosminCretu 实际上我确实最终找到了关于它的文档。我只需要搜索“Google API 字段参数”而不是“Google Vision API 字段参数”，这很烦人……developers.google.com/drive/api/v3/performance#partial 是的，用 100 个不必要的数据解析所有这些数据会产生很多开销返回的 x,y 坐标这是一个很棒的链接！ 【参考方案1】：

我想通了。我找不到任何有关如何执行此操作的文档，我只能猜测半小时。如果有人知道这方面的任何文档，请告诉我。

无论如何，您都可以使用“字段”参数来缩小响应范围，如下所示：

POST: https://vision.googleapis.com/v1/images:annotate?key=<MY_KEY>&fields=responses.fullTextAnnotation.text

这只会返回来自 Google Vision 文本检测 API 的菜单文本

【讨论】：

以上是关于Google Vision 文本检测返回过多不必要的数据的主要内容，如果未能解决你的问题，请参考以下文章

Google Vision API：图片上包含英文和阿拉伯文

如何使用 Google Vision Api 检测块内的所有文本

Google Vision API 文本检测奇怪行为 - Javascript

Google Vision Api 支持 PDF 和 TIFF 文本检测，但它也可以与包含图像的 PDf 一起使用吗？

如何使用 google vision api 从图像中进行文本检测？

Google Cloud Vision OCR 遗漏了单个数字和符号