Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据
Posted
技术标签:
【中文标题】Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据【英文标题】:Google Cloud Vision - Data Set cannot be split into train, validation, test data 【发布时间】:2021-03-08 23:13:02 【问题描述】:我正在尝试使用 Google Cloud Vision 构建对象检测模型。模型应该在大米周围绘制边界框
到目前为止我做了什么:
-
我已导入包含 15 张图片的图片集
我使用 Google Cloud 工具在 10 张图片中绘制了大约 550 个边界框
我被困在哪里: 我之前建过模型,数据集自动拆分为训练集、验证集和测试集。不过,这一次,Google Cloud 并未拆分数据集。
我尝试过的:
-
下载带有标记数据的 .csv 文件并将其重新导入 Google Cloud
在我现在拥有的一个标签之外添加更多标签
删除并重新创建数据集
如何让 Google Cloud 拆分数据集?
【问题讨论】:
据我所知,没有办法直接在 GCP 上执行此操作,您需要使用不同的工具拆分数据集 【参考方案1】:您的问题是 Google Cloud Platform在您上传图片时确定了您的训练集、测试集和验证集。您的测试和验证图像可能是您的最后 5 张图像,如果您还没有标记它们,它们将无法用于训练。如果您标记所有图像或从数据集中删除这些图像,您应该能够进行训练。 See this SO answer 了解更多信息。
您可以通过单击Export Data
选项并下载数据集的 CSV 来验证这一点:您可以看到数据集类别已经定义,即使对于尚未标记的图像也是如此。
【讨论】:
以上是关于Google Cloud Vision - 数据集不能拆分为训练、验证、测试数据的主要内容,如果未能解决你的问题,请参考以下文章
Google Cloud Vision API“错误的图像数据”错误
如何提高google cloud vision api的处理速度?
PHP Google Cloud Vision API:注释立即淹没内存
json Google Cloud Vision API OpenAPI