我怎样才能做一个不同的总和?
Posted
技术标签:
【中文标题】我怎样才能做一个不同的总和?【英文标题】:How can I do a distinct sum? 【发布时间】:2015-08-17 23:13:07 【问题描述】:我正在尝试创建一个“分数”统计数据,该数据源自某个列的值,计算为案例表达式的总和。不幸的是,查询结构需要是完全外连接(这是从实际查询中简化的,连接结构从原始代码中保留下来),因此总和是不正确的,因为每一行可能会出现多次。我可以按唯一键分组;但是,这会破坏同一查询中的其他聚合函数。
我真正想做的是 sum (case when ... distinct claim_id) 当然不存在;有没有一种方法可以满足我的需要?或者这必须是两个查询?
这是红移,以防万一。
create table t1 (id int, proc_date date, claim_id int, proc_code char(1));
create table t2 (id int, diag_date date, claim_id int);
insert into t1 (id, proc_date, claim_id, proc_code)
values (1, '2012-01-01', 0, 'a'),
(2, '2009-02-01', 1, 'b'),
(2, '2019-02-01', 2, 'c'),
(2, '2029-02-01', 3, 'd'),
(3, '2016-04-02', 4, 'e'),
(4, '2005-01-03', 5, 'f'),
(5, '2008-02-03', 6, 'g');
insert into t2 (id, diag_date, claim_id)
values (4, '2004-01-01', 20),
(5, '2010-02-01', 21),
(6, '2007-04-02', 22),
(5, '2011-02-01', 23),
(6, '2008-04-02', 24),
(5, '2012-02-01', 25),
(6, '2009-04-02', 26),
(7, '2002-01-03', 27),
(8, '2001-02-03', 28);
select id, sum(case when proc_code='a' then 5
when proc_code='b' then 10
when proc_code='c' then 15
when proc_code='d' then 20
when proc_code='e' then 25
when proc_code='f' then 30
when proc_code='g' then 35 end), count(distinct t1.claim_id) as proc_count, min(proc_date) as min_proc_date
from t1 full outer join t2 using (id) group by id order by id;
【问题讨论】:
您可以将else 0
添加到case when
以摆脱总和中的null
值,我认为0
更适合那里。你甚至可以在没有大小写的情况下做到这一点:(ASCII(proc_code) - ASCII('a') + 1) * 5
@maraca 不确定你在做什么,但 NULL
被聚合函数忽略。 0
与 NULL
对 SUM()
没有影响
@HartCO 执行您的查询,您将在SUM
列中获得NULL
值,在我看来,总和应该是0
然后,对于min_date,它为NULL 时是可以的.当所有的值都为 NULL 时,根本没有要求和的值是一个问题。
@maraca 是的,我只是感到困惑,因为我认为您是在暗示这是 OP 遇到的问题的一部分。
【参考方案1】:
您可以将条件聚合分离到cte
或子查询中,并使用OVER(PARTITION BY id)
获得id
级别的聚合而不进行分组,如下所示:
with cte AS (SELECT *,sum(case when proc_code='a' then 5
when proc_code='b' then 10
when proc_code='c' then 15
when proc_code='d' then 20
when proc_code='e' then 25
when proc_code='f' then 30
when proc_code='g' then 35 end) OVER(PARTITION BY id) AS Some_Sum
, min(proc_date) OVER(PARTITION BY id) as min_proc_date
FROM t1
)
select id
, Some_Sum
, count(distinct cte.claim_id) as proc_count
, min_proc_date
from cte
full outer join t2 using (id)
group by id,Some_Sum,min_proc_Date
order by id;
演示:SQL Fiddle
请注意,您必须将这些聚合添加到外部查询中的GROUP BY
,并且您的PARTITION BY
中的字段应该与您之前在GROUP BY
中使用的t1
字段相匹配,在这种情况下只是id
,但如果您的完整查询在 GROUP BY
中有其他 t1
字段,请务必将它们添加到 PARTITION BY
【讨论】:
【参考方案2】:您可以使用子查询(通过 id 和 id_claim)然后重新组合:
with base as (
select id, avg(case when proc_code='a' then 5
when proc_code='b' then 10
when proc_code='c' then 15
when proc_code='d' then 20
when proc_code='e' then 25
when proc_code='f' then 30
when proc_code='g' then 35 end) as value_proc,
t1.claim_id , min(proc_date) as min_proc_date
from t1 full outer join t2 using (id) group by id, t1.claim_id order by id, t1.claim_id)
select id, sum(value_proc), count(distinct claim_id) as proc_count, min(min_proc_date) as min_proc_date
from base
group by id
order by id;
看到我建议avg
用于内部子查询,但如果您确定相同的claim_id 具有相同的字母,您可以使用max
或min
,那是整数。如果不是更喜欢这个。
【讨论】:
以上是关于我怎样才能做一个不同的总和?的主要内容,如果未能解决你的问题,请参考以下文章
使用 SBT,我怎样才能拥有两个具有不同设置的不同 proguard 任务?