多次训练同一个 Google AutoML 模型

Posted

技术标签:

【中文标题】多次训练同一个 Google AutoML 模型【英文标题】:Training the same Google AutoML Model multiple times 【发布时间】:2020-06-27 07:53:03 【问题描述】:

问题:是否可以多次训练来自 Google AutoML 的同一个模型?

问题:我有几个包含时间序列数据的数据集。示例:

数据集 A:[[product1, date1, price], [product1, date2, price]] 数据集 B:[[product2, date1, price], [product2, date2, price]] 数据集 C:[[product3, date1, price], [product3, date2, price]]

在 Google AutoML 中描述列时,您可以将数据标记为时间序列数据,并将日期列指定为时间序列。记住它是时间序列数据非常重要。我认为合并数据集不是一个好主意,因为会有重复的日期。

是否可以在数据集 A 上训练模型,然后在数据集 B 等上完成训练,或者您会建议合并数据集吗?

谢谢。

【问题讨论】:

【参考方案1】:

你可以结合数据,我不明白这与你所描述的有什么关系。将列标记为Time 列具有基于该列的 AutoML Tables split the data,将最旧的 80% 作为训练集,接下来的 10% 作为验证集,最近的 10% 作为测试集.

如果您的集合中没有足够的数据在时间列中不同,无法将数据拆分为上述 80/10/10,您将不希望将其标记为时间列,而是手动拆分数据。

如果数据集不相关且彼此不同,那么您需要为每个数据集训练单独的模型。

【讨论】:

嗨,Caleb,感谢您的回复。我假设顺序(时间)对于 AutoML 使用的底层架构很重要。但是,在阅读了您提供的文件后,现在很清楚了。但是,我真正想问的是:如果我有一个导出并执行下降的旧模型,并且我有新数据可以用来训练该模型以使其变得更好。是否可以训练旧模型,还是必须将旧数据与新数据结合起来训练新模型 您需要合并数据才能做到这一点。没有办法提供模型和一些数据并重新训练。

以上是关于多次训练同一个 Google AutoML 模型的主要内容,如果未能解决你的问题,请参考以下文章

如何杀死正在运行的 google AUTOML 训练作业

Google AutoML 对象检测数据拆分错误

使用 AutoML 训练模型时出现“内部”错误

AutoML VISION Google SingleLabel 分类输出 TopK 结果

利用 AutoML 的功能构建和部署 TensorFlow.js 模型

在 Cloud AutoML Vision 中将图像导入 Google 存储时出错