我怎样才能做一个不同的总和?

Posted

技术标签:

【中文标题】我怎样才能做一个不同的总和?【英文标题】:How can I do a distinct sum? 【发布时间】:2015-08-17 23:13:07 【问题描述】:

我正在尝试创建一个“分数”统计数据,该数据源自某个列的值,计算为案例表达式的总和。不幸的是,查询结构需要是完全外连接(这是从实际查询中简化的,连接结构从原始代码中保留下来),因此总和是不正确的,因为每一行可能会出现多次。我可以按唯一键分组;但是,这会破坏同一查询中的其他聚合函数。

我真正想做的是 sum (case when ... distinct claim_id) 当然不存在;有没有一种方法可以满足我的需要?或者这必须是两个查询?

这是红移,以防万一。

create table t1 (id int, proc_date date, claim_id int, proc_code char(1));
create table t2 (id int, diag_date date, claim_id int);

insert into t1 (id, proc_date, claim_id, proc_code)
values (1, '2012-01-01', 0, 'a'),
(2, '2009-02-01', 1, 'b'),
(2, '2019-02-01', 2, 'c'),
(2, '2029-02-01', 3, 'd'),
(3, '2016-04-02', 4, 'e'),
(4, '2005-01-03', 5, 'f'),
(5, '2008-02-03', 6, 'g');

insert into t2 (id, diag_date, claim_id)
values (4, '2004-01-01', 20),
(5, '2010-02-01', 21),
(6, '2007-04-02', 22),
(5, '2011-02-01', 23),
(6, '2008-04-02', 24),
(5, '2012-02-01', 25),
(6, '2009-04-02', 26),
(7, '2002-01-03', 27),
(8, '2001-02-03', 28);

select id, sum(case when proc_code='a' then 5
         when proc_code='b' then 10
         when proc_code='c' then 15
         when proc_code='d' then 20
         when proc_code='e' then 25
         when proc_code='f' then 30
         when proc_code='g' then 35 end), count(distinct t1.claim_id) as proc_count, min(proc_date) as min_proc_date

from t1 full outer join t2 using (id) group by id order by id;

【问题讨论】:

您可以将else 0 添加到case when 以摆脱总和中的null 值,我认为0 更适合那里。你甚至可以在没有大小写的情况下做到这一点:(ASCII(proc_code) - ASCII('a') + 1) * 5 @maraca 不确定你在做什么,但 NULL 被聚合函数忽略。 0NULLSUM() 没有影响 @HartCO 执行您的查询,您将在SUM 列中获得NULL 值,在我看来,总和应该是0 然后,对于min_date,它为NULL 时是可以的.当所有的值都为 NULL 时,根本没有要求和的值是一个问题。 @maraca 是的,我只是感到困惑,因为我认为您是在暗示这是 OP 遇到的问题的一部分。 【参考方案1】:

您可以将条件聚合分离到cte 或子查询中,并使用OVER(PARTITION BY id) 获得id 级别的聚合而不进行分组,如下所示:

with cte AS (SELECT *,sum(case when proc_code='a' then 5
                               when proc_code='b' then 10
                               when proc_code='c' then 15
                               when proc_code='d' then 20
                               when proc_code='e' then 25
                               when proc_code='f' then 30
                               when proc_code='g' then 35 end) OVER(PARTITION BY id) AS Some_Sum                  
                  , min(proc_date) OVER(PARTITION BY id) as min_proc_date
             FROM t1
             )
select id
     , Some_Sum
     , count(distinct cte.claim_id) as proc_count
     , min_proc_date
from cte 
full outer join t2 using (id) 
group by id,Some_Sum,min_proc_Date 
order by id;

演示:SQL Fiddle

请注意,您必须将这些聚合添加到外部查询中的GROUP BY,并且您的PARTITION BY 中的字段应该与您之前在GROUP BY 中使用的t1 字段相匹配,在这种情况下只是id,但如果您的完整查询在 GROUP BY 中有其他 t1 字段,请务必将它们添加到 PARTITION BY

【讨论】:

【参考方案2】:

您可以使用子查询(通过 id 和 id_claim)然后重新组合:

with base as (
select id, avg(case when proc_code='a' then 5
         when proc_code='b' then 10
         when proc_code='c' then 15
         when proc_code='d' then 20
         when proc_code='e' then 25
         when proc_code='f' then 30
         when proc_code='g' then 35 end) as value_proc, 
         t1.claim_id , min(proc_date) as min_proc_date
  from t1 full outer join t2 using (id) group by id, t1.claim_id order by id, t1.claim_id) 
 select id, sum(value_proc), count(distinct claim_id) as proc_count,  min(min_proc_date) as min_proc_date
   from base
   group by id
   order by id;

看到我建议avg 用于内部子查询,但如果您确定相同的claim_id 具有相同的字母,您可以使用maxmin,那是整数。如果不是更喜欢这个。

【讨论】:

以上是关于我怎样才能做一个不同的总和?的主要内容,如果未能解决你的问题,请参考以下文章

多列的大小写和总和

我们怎样才能得到一个情节箱线图背后的不同统计数据?

我怎样才能用jquery做一个循环?

使用 SBT,我怎样才能拥有两个具有不同设置的不同 proguard 任务?

具有一个日期和三个不同值的数据框:我怎样才能得到中间的那个?

我怎样才能只为第一个函数调用做某事?