如何使用 Microsoft OCR 改进文本识别?

Posted

技术标签:

【中文标题】如何使用 Microsoft OCR 改进文本识别?【英文标题】:How to improve text recognition using Microsoft OCR? 【发布时间】:2017-11-29 21:18:31 【问题描述】:

我正在使用 Microsoft OCR 库,我想知道是否有某种方法可以改进我的语言的文本识别。我使用 OCR 库运行了一个程序,但对我提供的图像的某些单词的检测很差。

我已经知道 OCR 支持西班牙语,但它没有正确处理所有单词,例如:

我在 json 中得到的响应是:

    ...
         "boundingBox": "358,180,271,278",
         "lines": [
            
               "boundingBox": "362,180,67,17",
               "words": [
                  


             "boundingBox": "362,180,67,17",
                 "text": "Nonúre"
              
           ]
        ,
        
           "boundingBox": "358,208,118,22",
           "words": [
              
                 "boundingBox": "358,208,63,22",
                 "text": "tlgcT2"
              ,
              
                 "boundingBox": "428,217,7,4",
                 "text": "-"
              ,
              
                 "boundingBox": "441,210,35,16",
                 "text": "ED6"
              
           ]
        ,
    ...

将“Nombre”标识为“Nonúre”和“CT2(来自 CT2 - ED6)tlgcT2

有什么办法可以提高文本识别率?

【问题讨论】:

【参考方案1】:

这很正常,您使用的是 OCR V1 并且正常运行呵呵。您需要使用版本 2 检查此 URL OCR V2。基本上你需要对你的 URL 做一些改变。 我不知道为什么微软使用 V1 到默认版本可能是因为它是和预览版......但你可以使用它! 现在,当您提取 OCR Text 或 OCR Json 时,检测效果会更好。

示例: Using OCR v2 with Postman

如果它对你有用,请告诉我。

【讨论】:

以上是关于如何使用 Microsoft OCR 改进文本识别?的主要内容,如果未能解决你的问题,请参考以下文章

使用模糊文本改进 Tesseract OCR 结果

OCR算法改进

如何使用不同颜色和字体的文本改进图像的 OCR?

如何使用 OpenCV 进行 OCR 和文本检测识别

如何识别作为光学字符识别 (OCR) 输出的文本中的实体?

如何在python中使用OCR从图像中获取文本识别器的坐标