如何使用 Google 的 AutoML 进行 OCR

Posted 2023-04-17

技术标签:

【中文标题】如何使用 Google 的 AutoML 进行 OCR【英文标题】：How to do OCR with Google's AutoML 【发布时间】：2020-10-15 21:04:12 【问题描述】：

我想做 OCR，我知道 Cloud Vision API 支持它。但我有兴趣为它制作我的自定义模型，并希望使用 AutoML。但我找不到任何与使用 AutoML 的 OCR 相关的内容。是否可以使用 AutoML 进行 OCR？我们该怎么做呢？我知道这是一个非常开放的问题，但我希望能得到一些帮助。

【问题讨论】：

【参考方案1】：

您无法通过 AutoML 进行 OCR。您的选择是使用 Cloud Vision API 进行 OCR，然后应用您自己的算法以某种方式将检测到的字母组合在一起，或者从头开始训练您自己的 OCR 模型（不推荐）。

【讨论】：

【参考方案2】：

AutoML Natural Language 可以对 PDF 进行 OCR；然而，这只是一个步骤，因为它旨在创建关于文本分类、实体提取或情感分析的模型。

如果您的目标只是执行 OCR，最好的方法是 Vision API。

【讨论】：

以上是关于如何使用 Google 的 AutoML 进行 OCR的主要内容，如果未能解决你的问题，请参考以下文章