Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据

Posted

技术标签:

【中文标题】Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据【英文标题】:Google Cloud Vision - Data Set cannot be split into train, validation, test data 【发布时间】:2021-03-08 23:13:02 【问题描述】:

我正在尝试使用 Google Cloud Vision 构建对象检测模型。模型应该在大米周围绘制边界框

到目前为止我做了什么:

    我已导入包含 15 张图片的图片集 我使用 Google Cloud 工具在 10 张图片中绘制了大约 550 个边界框

我被困在哪里: 我之前建过模型,数据集自动拆分为训练集、验证集和测试集。不过,这一次,Google Cloud 并未拆分数据集。

我尝试过的:

    下载带有标记数据的 .csv 文件并将其重新导入 Google Cloud 在我现在拥有的一个标签之外添加更多标签 删除并重新创建数据集

如何让 Google Cloud 拆分数据集?

【问题讨论】:

据我所知,没有办法直接在 GCP 上执行此操作,您需要使用不同的工具拆分数据集 【参考方案1】:

您的问题是 Google Cloud Platform在您上传图片时确定了您的训练集、测试集和验证集。您的测试和验证图像可能是您的最后 5 张图像,如果您还没有标记它们,它们将无法用于训练。如果您标记所有图像或从数据集中删除这些图像,您应该能够进行训练。 See this SO answer 了解更多信息。

您可以通过单击Export Data 选项并下载数据集的 CSV 来验证这一点:您可以看到数据集类别已经定义,即使对于尚未标记的图像也是如此。

【讨论】:

以上是关于Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据的主要内容,如果未能解决你的问题,请参考以下文章

Google Cloud Vision API“错误的图像数据”错误

如何提高google cloud vision api的处理速度?

PHP Google Cloud Vision API:注释立即淹没内存

json Google Cloud Vision API OpenAPI

Google Cloud Vision - 解析期间发生 PHP 错误

Google Cloud Vision Document OCR - 在结果文本中保留布局