Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据

Posted 2023-04-17

技术标签:

【中文标题】Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据【英文标题】：Google Cloud Vision - Data Set cannot be split into train, validation, test data 【发布时间】：2021-03-08 23:13:02 【问题描述】：

我正在尝试使用 Google Cloud Vision 构建对象检测模型。模型应该在大米周围绘制边界框

到目前为止我做了什么：

我已导入包含 15 张图片的图片集我使用 Google Cloud 工具在 10 张图片中绘制了大约 550 个边界框

我被困在哪里： 我之前建过模型，数据集自动拆分为训练集、验证集和测试集。不过，这一次，Google Cloud 并未拆分数据集。

我尝试过的：

下载带有标记数据的 .csv 文件并将其重新导入 Google Cloud 在我现在拥有的一个标签之外添加更多标签删除并重新创建数据集

如何让 Google Cloud 拆分数据集？

【问题讨论】：

据我所知，没有办法直接在 GCP 上执行此操作，您需要使用不同的工具拆分数据集 【参考方案1】：

您的问题是 Google Cloud Platform在您上传图片时确定了您的训练集、测试集和验证集。您的测试和验证图像可能是您的最后 5 张图像，如果您还没有标记它们，它们将无法用于训练。如果您标记所有图像或从数据集中删除这些图像，您应该能够进行训练。 See this SO answer 了解更多信息。

您可以通过单击Export Data 选项并下载数据集的 CSV 来验证这一点：您可以看到数据集类别已经定义，即使对于尚未标记的图像也是如此。

【讨论】：

以上是关于Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据的主要内容，如果未能解决你的问题，请参考以下文章

Google Cloud Vision API“错误的图像数据”错误

如何提高google cloud vision api的处理速度？

PHP Google Cloud Vision API：注释立即淹没内存

json Google Cloud Vision API OpenAPI

Google Cloud Vision - 解析期间发生 PHP 错误

Google Cloud Vision Document OCR - 在结果文本中保留布局