Google AutoML 对象检测数据拆分错误

Posted

技术标签:

【中文标题】Google AutoML 对象检测数据拆分错误【英文标题】:Google AutoML Object detection data split error 【发布时间】:2021-11-19 10:03:42 【问题描述】:

我有图像数据集,我正在尝试使用 Google 的 AutoML 对象检测来运行对象检测。

我手动将数据拆分为训练、测试和验证。

但是,当我将 csv 上传到数据集中时,我多次收到以下错误: “错误:使用示例 id 对示例进行了重复数据删除:2289134970725637758。”

我注意到它没有读取我在某个标签(鸡块)上设置为 VALIDATION 的图像。 此外,每次拆分的数量与我的 csv 上每次拆分的图像数量不匹配。

我需要模型来读取图像并将其分配给 SET(训练、测试或验证),我将其放在 CSV 中。

【问题讨论】:

【参考方案1】:

原因是你的一些例子是重复的。

我建议您检查您的 CSV 是否有重复的示例(图像 + 边界框),或者更具体地说,检查您的 VALIDATION 示例以获取该特定标签,以确保您没有重复其他集合中的示例。

如果你还没有,你也应该通过CSV formatting guidelines,以防万一。

如果您找不到任何重复项,那么我建议您创建一个issue tracker。

【讨论】:

以上是关于Google AutoML 对象检测数据拆分错误的主要内容,如果未能解决你的问题,请参考以下文章

Google AutoML 训练错误/无法部署模型

如何杀死正在运行的 google AUTOML 训练作业

(Google AutoML) 错误:3 INVALID_ARGUMENT:不支持的有效负载类型“行”

Google Vertex AI AutoML - 无法为 CSV 数据集指定架构

Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据

多次训练同一个 Google AutoML 模型