多次训练同一个 Google AutoML 模型

Posted 2023-03-29

技术标签:

【中文标题】多次训练同一个 Google AutoML 模型【英文标题】：Training the same Google AutoML Model multiple times 【发布时间】：2020-06-27 07:53:03 【问题描述】：

问题：是否可以多次训练来自 Google AutoML 的同一个模型？

问题：我有几个包含时间序列数据的数据集。示例：

数据集 A：[[product1, date1, price], [product1, date2, price]] 数据集 B：[[product2, date1, price], [product2, date2, price]] 数据集 C：[[product3, date1, price], [product3, date2, price]]

在 Google AutoML 中描述列时，您可以将数据标记为时间序列数据，并将日期列指定为时间序列。记住它是时间序列数据非常重要。我认为合并数据集不是一个好主意，因为会有重复的日期。

是否可以在数据集 A 上训练模型，然后在数据集 B 等上完成训练，或者您会建议合并数据集吗？

谢谢。

【问题讨论】：

【参考方案1】：

你可以结合数据，我不明白这与你所描述的有什么关系。将列标记为Time 列具有基于该列的 AutoML Tables split the data，将最旧的 80% 作为训练集，接下来的 10% 作为验证集，最近的 10% 作为测试集.

如果您的集合中没有足够的数据在时间列中不同，无法将数据拆分为上述 80/10/10，您将不希望将其标记为时间列，而是手动拆分数据。

如果数据集不相关且彼此不同，那么您需要为每个数据集训练单独的模型。

【讨论】：

嗨，Caleb，感谢您的回复。我假设顺序（时间）对于 AutoML 使用的底层架构很重要。但是，在阅读了您提供的文件后，现在很清楚了。但是，我真正想问的是：如果我有一个导出并执行下降的旧模型，并且我有新数据可以用来训练该模型以使其变得更好。是否可以训练旧模型，还是必须将旧数据与新数据结合起来训练新模型？您需要合并数据才能做到这一点。没有办法提供模型和一些数据并重新训练。

以上是关于多次训练同一个 Google AutoML 模型的主要内容，如果未能解决你的问题，请参考以下文章

如何杀死正在运行的 google AUTOML 训练作业

Google AutoML 对象检测数据拆分错误

使用 AutoML 训练模型时出现“内部”错误

AutoML VISION Google SingleLabel 分类输出 TopK 结果

利用 AutoML 的功能构建和部署 TensorFlow.js 模型

在 Cloud AutoML Vision 中将图像导入 Google 存储时出错