Pandas UDF Facebook Prophet / 多个参数
Posted
技术标签:
【中文标题】Pandas UDF Facebook Prophet / 多个参数【英文标题】:Pandas UDF Facebook Prophet / multiple parameters 【发布时间】:2021-02-07 03:14:23 【问题描述】:我正在尝试使用 Spark 上的 Facebook Prophet 和 Pandas UDF 扩展多个模型。 一切正常,但我想通过为函数提供不同的参数来改进模型。
该函数在我的数据集的 ID 列上分组,该列是国家和产品的组合。 我希望将国家/地区特定假期应用于模型的功能,添加到我用来例如消除 COVID19 对数据的影响的一般季节性数据框中。最终我想根据 ID 值更改任何其他参数(例如不同类型的增长)。
感谢您的热心帮助。
【问题讨论】:
【参考方案1】:我认为我解决该问题的方法是在训练数据集中添加另一列,然后为每个相应的模型 ID 指向该列的第一个值。
因此,例如,如果数据具有不同 ID 的每日数据点(如果 ID 与美国国家/地区相关),则新列将指向该国家/地区季节性值。
日期、ID、值、国家/地区 4/1, US-Item1, 10, US 4/1, IT-项目 1, 5, IT 4/1,US-Item2,15,US
【讨论】:
以上是关于Pandas UDF Facebook Prophet / 多个参数的主要内容,如果未能解决你的问题,请参考以下文章
使用 Pandas 抛出错误在 Python 中编写 UDF
如何在 pyspark.sql.functions.pandas_udf 和 pyspark.sql.functions.udf 之间进行选择?