我将如何进行图像标记/分类？

Posted 2023-03-12

技术标签:

【中文标题】我将如何进行图像标记/分类？【英文标题】：How would I go about image labeling/Classification? 【发布时间】：2019-09-26 14:28:31 【问题描述】：

假设我有一组护照图像。我正在做一个项目，我必须识别每本护照上的姓名，并最终将该对象转换为文本。

对于每本护照上的姓名标签（或分类（我认为是初学者））的第一部分，我该怎么做？

我可以使用哪些技术/软件来完成此任务？

非常详细或任何链接都会很棒。我正在试图弄清楚这是如何完成的，以便我可以开始编码

我知道可能涉及到训练模型，但我不确定

如果这很重要，我正在使用 Python。

谢谢

【问题讨论】：

【参考方案1】：

您可以采用两种方法，一种是您已标记数据（或者您想自己标记数据），另一种是您没有标记数据。

让我们从后者开始。假设您有一张护照的图像。您想检测图像中的文本在哪里，以及该文本在说什么。您可以使用名为pytessaract 的库来实现此目的。这是一个为你做这件事的人工智能。它运行良好，因为它已经在许多其他图像上进行了训练，因此它可以很好地检测 any 图像中的文本。

如果您有标签，您或许可以改进您可以使用pytessaract 制作的模型，但这要困难得多。如果你还是想学，我建议你用学习ŧensorflow，并使用“迁移学习”来改进你的模型。

【讨论】：

谢谢！我将如何自己标记图像？如果我想自己为图像添加标签怎么办对于实际的标签，您需要在图像中的文本周围绘制边界框，并为每个边界框标记其中的文本。所以当我进行标记时，假设我正在处理 2000 张图像，我标记为 500。我是否会标记我想要的文本，以便能够提供培训所以其余的可以使用机器学习自动标记？如果从头开始（即不使用迁移学习），500 张图像将不足以进行普通（无额外处理）文本检测。如果你确实使用了迁移学习，500 张额外的图像可能会更好一些，但不会有太大的不同。我知道你要求分类，但我认为你在这里不需要。因为护照是 - 好吧 - 护照我会使用 numpy 分隔所有字母，并通过使用简单的预训练模型甚至将其与模板进行比较来单独识别每个字母（因为所有护照（可能）都有相同的字体。

以上是关于我将如何进行图像标记/分类？的主要内容，如果未能解决你的问题，请参考以下文章