多次训练同一个 Google AutoML 模型
Posted
技术标签:
【中文标题】多次训练同一个 Google AutoML 模型【英文标题】:Training the same Google AutoML Model multiple times 【发布时间】:2020-06-27 07:53:03 【问题描述】:问题:是否可以多次训练来自 Google AutoML 的同一个模型?
问题:我有几个包含时间序列数据的数据集。示例:
数据集 A:[[product1, date1, price], [product1, date2, price]] 数据集 B:[[product2, date1, price], [product2, date2, price]] 数据集 C:[[product3, date1, price], [product3, date2, price]]在 Google AutoML 中描述列时,您可以将数据标记为时间序列数据,并将日期列指定为时间序列。记住它是时间序列数据非常重要。我认为合并数据集不是一个好主意,因为会有重复的日期。
是否可以在数据集 A 上训练模型,然后在数据集 B 等上完成训练,或者您会建议合并数据集吗?
谢谢。
【问题讨论】:
【参考方案1】:你可以结合数据,我不明白这与你所描述的有什么关系。将列标记为Time
列具有基于该列的 AutoML Tables split the data,将最旧的 80% 作为训练集,接下来的 10% 作为验证集,最近的 10% 作为测试集.
如果您的集合中没有足够的数据在时间列中不同,无法将数据拆分为上述 80/10/10,您将不希望将其标记为时间列,而是手动拆分数据。
如果数据集不相关且彼此不同,那么您需要为每个数据集训练单独的模型。
【讨论】:
嗨,Caleb,感谢您的回复。我假设顺序(时间)对于 AutoML 使用的底层架构很重要。但是,在阅读了您提供的文件后,现在很清楚了。但是,我真正想问的是:如果我有一个导出并执行下降的旧模型,并且我有新数据可以用来训练该模型以使其变得更好。是否可以训练旧模型,还是必须将旧数据与新数据结合起来训练新模型? 您需要合并数据才能做到这一点。没有办法提供模型和一些数据并重新训练。以上是关于多次训练同一个 Google AutoML 模型的主要内容,如果未能解决你的问题,请参考以下文章
AutoML VISION Google SingleLabel 分类输出 TopK 结果