SQL 中的自定义聚合

Posted

技术标签:

【中文标题】SQL 中的自定义聚合【英文标题】:Custom aggregations in SQL 【发布时间】:2018-10-19 22:44:37 【问题描述】:

我有一个名为行业的表。有6个字段。架构如下。

在这种情况下,我需要执行自定义聚合。数据库中有 22 个区域。需要进行两个自定义聚合:

    需要将区域 1-17 合并为一个值为 00 的新区域。 区域 20 和 21 需要改成另一个区域,代码值为 99。

接下来是我对此总体框架的尝试。我假设创建一个新表是完成此操作的最简单方法。底部是预期结果的一个非常简短的示例。

 create table industry2
 (
 year char(4),
 qtr char(2),
 area char(6),
 industry char(3),
 ownership char(2),
 employment numeric(8,0)
 );

 INSERT INTO Industry2
 (year, qtr, area, industry, ownership, employment)
 SELECT year, qtr, area, (select sum (employment) from dbo.industry where area 
 = '01' or area = '02' and so on):

 2017    01    01   123000    1    456
 2017    01    02   123000    1    101
 2017    01    03   123000    1    103
 2017    01    01   134000    1      6
 2017    01    02   134000    1      7
 2017    01    03   134000    1     12
 2017    01    09   134000    1      1
 2017    01    01   144000    1     14
 2017    01    20   134000    1      7
 2017    01    21   134000    1      8

预期结果

 2017   01     00   123000    1    660
 2017   01     00   134000    1     26
 2017   01     00   144000    1     14
 2017   01     99   134000    1     15

【问题讨论】:

【参考方案1】:

您可以使用CASE WHEN 语句定义您的自定义GROUP BY 子句:

select  [year], 
        [qtr],
        case when [area] in('20','21') then '99' when [area] between 1 and 17 then '00' end as [area], 
        [industry], 
        [ownership], 
        sum([employment]) as [employment_sum] 
from industry2 
group by  
    [year], 
    [qtr], 
    case when [area] in('20','21') then '99' when [area] between 1 and 17 then '00' end, 
    [industry], 
    [ownership] 

结果:

【讨论】:

感谢您的帮助。不过,最后一项。如果我想让它成为我正在查询的表的一部分,如何做到这一点? @Calflamesfann 由于group by 操作会改变数据粒度,因此不可能将其作为表的一部分。如果您需要对查询进行参数化,最好的办法可能是创建一个视图或表值函数 最后一个。如果我需要将语句更改为区域在 1 到 17 之间的位置,而与区域 99(由 20 和 21 组成)无关,我是否执行以下操作。 select.... from industry where area = 'x' or area = 'y' group by... @Calflamesfann 是的,如果要过滤数据集,可以在 group by 子句之前添加 where 条件,但请务必使用原始值(1-17、20、21 ) 而不是“新”的(99 和 00)

以上是关于SQL 中的自定义聚合的主要内容,如果未能解决你的问题,请参考以下文章

python中的自定义pivot_ui聚合器?

SQL 中的自定义聚合

Flink Table API & SQL 自定义 Aggregate 聚合函数

Flink Table API & SQL 自定义 Aggregate 聚合函数

SQL Server 中的自定义聚合函数 (concat)

sql server 中的自定义函数应该如何调用?