获得对 Google Vision OCR 文本注释结果的信心

Posted 2023-04-17

技术标签:

【中文标题】获得对 Google Vision OCR 文本注释结果的信心【英文标题】：Get confidence of Google Vision OCR text annotation result 【发布时间】：2020-08-13 12:34:33 【问题描述】：

我在图像上运行 OCR 获得的结果（基于 this tutorial）不包括置信度分数。有没有办法获取这些信息？

documentation 将 score 列为应返回的值之一，但我没有看到它。

这是我看到的输出：

description: "&"
bounding_poly 
  vertices 
    x: 435
    y: 959
  
  vertices 
    x: 459
    y: 960
  
  vertices 
    x: 458
    y: 990
  
  vertices 
    x: 434
    y: 989

【问题讨论】：

【参考方案1】：

您的文档链接转到与 OCR 无关的“实体注释”部分。

如果您将请求的类型设置为“DOCUMENT_TEXT_DETECTION”，您可以获得某种 OCR 结果的分数（置信度）：

....
 "symbols": [
                          
                            "property": 
                              "detectedLanguages": [
                                
                                  "languageCode": "en"
                                
                              ]
                            ,
                            "boundingBox": 
                              "vertices": [....]
                            ,
                            "text": "T",
                            "confidence": 0.99
                          , 
....

“TEXT_DETECTION”类型的结果不会为您提供任何置信度值。

您可以在这里轻松尝试不同之处： https://cloud.google.com/vision/docs/ocr

【讨论】：

以上是关于获得对 Google Vision OCR 文本注释结果的信心的主要内容，如果未能解决你的问题，请参考以下文章

具有两列文本的 Google Vision 复杂 OCR 执行

使用 Google Vision API 进行 OCR 扫描的地图

Google Cloud Vision OCR 遗漏了单个数字和符号

使用 google vision OCR API 从特定图像位置提取数据

来自 Google Vision API 的 OCR 置信度得分

使用 Google Cloud Vision 的 OCR PDF 文件？