如何使用 Microsoft OCR 改进文本识别?
Posted
技术标签:
【中文标题】如何使用 Microsoft OCR 改进文本识别?【英文标题】:How to improve text recognition using Microsoft OCR? 【发布时间】:2017-11-29 21:18:31 【问题描述】:我正在使用 Microsoft OCR 库,我想知道是否有某种方法可以改进我的语言的文本识别。我使用 OCR 库运行了一个程序,但对我提供的图像的某些单词的检测很差。
我已经知道 OCR 支持西班牙语,但它没有正确处理所有单词,例如:
我在 json 中得到的响应是:
...
"boundingBox": "358,180,271,278",
"lines": [
"boundingBox": "362,180,67,17",
"words": [
"boundingBox": "362,180,67,17",
"text": "Nonúre"
]
,
"boundingBox": "358,208,118,22",
"words": [
"boundingBox": "358,208,63,22",
"text": "tlgcT2"
,
"boundingBox": "428,217,7,4",
"text": "-"
,
"boundingBox": "441,210,35,16",
"text": "ED6"
]
,
...
将“Nombre”标识为“Nonúre”和“CT2”(来自 CT2 - ED6) “tlgcT2”
有什么办法可以提高文本识别率?
【问题讨论】:
【参考方案1】:这很正常,您使用的是 OCR V1 并且正常运行呵呵。您需要使用版本 2 检查此 URL OCR V2。基本上你需要对你的 URL 做一些改变。 我不知道为什么微软使用 V1 到默认版本可能是因为它是和预览版......但你可以使用它! 现在,当您提取 OCR Text 或 OCR Json 时,检测效果会更好。
示例: Using OCR v2 with Postman
如果它对你有用,请告诉我。
【讨论】:
以上是关于如何使用 Microsoft OCR 改进文本识别?的主要内容,如果未能解决你的问题,请参考以下文章