如何使用 Google 的 AutoML 进行 OCR

Posted

技术标签:

【中文标题】如何使用 Google 的 AutoML 进行 OCR【英文标题】:How to do OCR with Google's AutoML 【发布时间】:2020-10-15 21:04:12 【问题描述】:

我想做 OCR,我知道 Cloud Vision API 支持它。但我有兴趣为它制作我的自定义模型,并希望使用 AutoML。但我找不到任何与使用 AutoML 的 OCR 相关的内容。是否可以使用 AutoML 进行 OCR?我们该怎么做呢?我知道这是一个非常开放的问题,但我希望能得到一些帮助。

【问题讨论】:

【参考方案1】:

您无法通过 AutoML 进行 OCR。您的选择是使用 Cloud Vision API 进行 OCR,然后应用您自己的算法以某种方式将检测到的字母组合在一起,或者从头开始训练您自己的 OCR 模型(不推荐)。

【讨论】:

【参考方案2】:

AutoML Natural Language 可以对 PDF 进行 OCR;然而,这只是一个步骤,因为它旨在创建关于文本分类、实体提取或情感分析的模型。

如果您的目标只是执行 OCR,最好的方法是 Vision API。

【讨论】:

以上是关于如何使用 Google 的 AutoML 进行 OCR的主要内容,如果未能解决你的问题,请参考以下文章

Google Vertex AI AutoML - 无法为 CSV 数据集指定架构

Google AutoML 对象检测数据拆分错误

如何使用 Web GUI 停止 Google Cloud AutoML(现为 Vertex AI)批量预测作业?

如何杀死正在运行的 google AUTOML 训练作业

如何解决 ModuleNotFoundError: No module named 'google.cloud' while importing automl in GAE Standard?

在 Cloud AutoML Vision 中将图像导入 Google 存储时出错