谷歌视觉更好的 OCR 的理想图像尺寸是多少?
Posted
技术标签:
【中文标题】谷歌视觉更好的 OCR 的理想图像尺寸是多少?【英文标题】:What is the Ideal image dimensions for better OCR by google vision? 【发布时间】:2019-04-06 14:55:51 【问题描述】:我使用 google vision OCR 已经有一段时间了。而且我观察到 OCR 结果随图像尺寸而变化。例如,尺寸为 720 x 1280 的图像比 360 x 720 的效果更好。有时反之则更差。
我在使用 Microsoft 的 OCR API 时也遇到过同样的情况。
那么,是否有一个理想的图像尺寸总是能提供良好的 OCR 结果?图片尺寸如何影响 OCR 结果?
【问题讨论】:
【参考方案1】:请在此处参考该信息:Google Supported images
FACE_DETECTION 1600 x 1200两眼之间的距离最重要
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 1024 x 768 OCR 需要更多 检测字符的分辨率
SAFE_SEARCH_DETECTION 640 x 480
Google Supported images
【讨论】:
【参考方案2】:根据下面的链接,不仅分辨率,纵横比也是一个因素 https://www.mlreader.com/prepare-image-for-google-vision-api
【讨论】:
以上是关于谷歌视觉更好的 OCR 的理想图像尺寸是多少?的主要内容,如果未能解决你的问题,请参考以下文章