谷歌视觉更好的 OCR 的理想图像尺寸是多少?

Posted

技术标签:

【中文标题】谷歌视觉更好的 OCR 的理想图像尺寸是多少?【英文标题】:What is the Ideal image dimensions for better OCR by google vision? 【发布时间】:2019-04-06 14:55:51 【问题描述】:

我使用 google vision OCR 已经有一段时间了。而且我观察到 OCR 结果随图像尺寸而变化。例如,尺寸为 720 x 1280 的图像比 360 x 720 的效果更好。有时反之则更差。

我在使用 Microsoft 的 OCR API 时也遇到过同样的情况。

那么,是否有一个理想的图像尺寸总是能提供良好的 OCR 结果?图片尺寸如何影响 OCR 结果?

【问题讨论】:

【参考方案1】:

请在此处参考该信息:Google Supported images

FACE_DETECTION 1600 x 1200两眼之间的距离最重要

LANDMARK_DETECTION 640 x 480

LOGO_DETECTION 640 x 480

LABEL_DETECTION 640 x 480

TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 1024 x 768 OCR 需要更多 检测字符的分辨率

SAFE_SEARCH_DETECTION 640 x 480

Google Supported images

【讨论】:

【参考方案2】:

根据下面的链接,不仅分辨率,纵横比也是一个因素 https://www.mlreader.com/prepare-image-for-google-vision-api

【讨论】:

以上是关于谷歌视觉更好的 OCR 的理想图像尺寸是多少?的主要内容,如果未能解决你的问题,请参考以下文章

如何在谷歌视觉ocr中获取键值对?

谷歌视觉ocr:竖横线条文本识别

使用谷歌视觉进行 OCR 的正确方法是啥

如何设置图像大小以改善 OCR 输出。?

来自谷歌云视觉 API OCR 的逐行数据

OCR的理想字体是什么?