如何为 Presto 编写自定义窗口函数?

Posted

技术标签:

【中文标题】如何为 Presto 编写自定义窗口函数?【英文标题】:How do I write a custom Window Function for Presto? 【发布时间】:2021-03-29 15:54:17 【问题描述】:

我想创建一个自定义 Window 函数,它处理排序的双精度流并为每个分区生成一个输出双精度。必须对值进行排序。 Window 函数一次可以处理单行(无需向后/向前看),只要它可以保持每个分区的内部状态。

签名看起来像这样:

SELECT my_windows_func() OVER (PARTITION BY my_key ORDER BY my_val ASC) AS my_stuff

现在,我想出了如何创建 AggreagtionFunctions、ScalarFunctions,但是对于 WindowFunctions,我不知道从哪里开始,也找不到任何在线文档。

我应该为我的用例实现哪个接口?我可以强制用户在调用时添加ORDER BY 子句吗?我可以参考任何示例代码吗?

【问题讨论】:

【参考方案1】:

函数实现需要从io.prestosql.spi.Plugin#getFunctions返回,并用@WindowFunctionSignature注解。 io.prestosql.spi.function.ValueWindowFunction 是实现窗口函数的有用基础。示例见https://github.com/trinodb/trino/blob/4fba34f3d94291d5411a5c24bd47fa0213898e51/presto-main/src/main/java/io/prestosql/operator/window/LagFunction.java。

【讨论】:

以上是关于如何为 Presto 编写自定义窗口函数?的主要内容,如果未能解决你的问题,请参考以下文章

Tkinter小技巧:如何为窗口右上角的‘x’添加一个自定义的响应函数

如何为自定义结构中定义的无序集编写自定义哈希函数?

如何为不同的观察组使用 LAG 和 LEAD 窗口函数

Athena (Presto) SQL 窗口函数

P10:自定义Hooks函数获取窗口大小

如何计算 Presto 中每 n 行的窗口函数?