谷歌视觉更好的 OCR 的理想图像尺寸是多少？

Posted 2023-04-17

技术标签:

【中文标题】谷歌视觉更好的 OCR 的理想图像尺寸是多少？【英文标题】：What is the Ideal image dimensions for better OCR by google vision? 【发布时间】：2019-04-06 14:55:51 【问题描述】：

我使用 google vision OCR 已经有一段时间了。而且我观察到 OCR 结果随图像尺寸而变化。例如，尺寸为 720 x 1280 的图像比 360 x 720 的效果更好。有时反之则更差。

我在使用 Microsoft 的 OCR API 时也遇到过同样的情况。

那么，是否有一个理想的图像尺寸总是能提供良好的 OCR 结果？图片尺寸如何影响 OCR 结果？

【问题讨论】：

【参考方案1】：

请在此处参考该信息：Google Supported images

FACE_DETECTION 1600 x 1200两眼之间的距离最重要

LANDMARK_DETECTION 640 x 480

LOGO_DETECTION 640 x 480

LABEL_DETECTION 640 x 480

TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 1024 x 768 OCR 需要更多检测字符的分辨率

SAFE_SEARCH_DETECTION 640 x 480

Google Supported images

【讨论】：

【参考方案2】：

根据下面的链接，不仅分辨率，纵横比也是一个因素 https://www.mlreader.com/prepare-image-for-google-vision-api

【讨论】：

以上是关于谷歌视觉更好的 OCR 的理想图像尺寸是多少？的主要内容，如果未能解决你的问题，请参考以下文章

来自谷歌云视觉 API OCR 的逐行数据

OCR的理想字体是什么？