在 Oracle 中使用和不使用 KEEP 进行分区

Posted 2023-03-31

技术标签:

【中文标题】在 Oracle 中使用和不使用 KEEP 进行分区【英文标题】：PARTITION BY with and without KEEP in Oracle 【发布时间】：2013-11-22 13:20:47 【问题描述】：

我遇到了两个似乎具有相同结果的查询：在分区上应用聚合函数。

我想知道这两个查询之间是否有任何区别：

SELECT empno,
   deptno,
   sal,
   MIN(sal) OVER (PARTITION BY deptno) "Lowest",
   MAX(sal) OVER (PARTITION BY deptno) "Highest"
FROM empl

SELECT empno,
   deptno,
   sal,
   MIN(sal) KEEP (DENSE_RANK FIRST ORDER BY sal) OVER (PARTITION BY deptno) "Lowest",
   MAX(sal) KEEP (DENSE_RANK LAST ORDER BY sal) OVER (PARTITION BY deptno) "Highest"
FROM empl

第一个版本更合乎逻辑，但第二个版本可能是某种特殊情况，也许是一些性能优化。

【问题讨论】：

【参考方案1】：

MIN(sal) KEEP (DENSE_RANK FIRST ORDER BY sal) OVER (PARTITION BY deptno)

可以（大致）按照从右到左的顺序来考虑该语句：

OVER (PARTITION BY deptno) 表示将行划分为不同的 deptno 组；那么 ORDER BY sal 表示，对于每个分区，按sal 对行进行排序（隐式使用ASCending order）；那么 KEEP (DENSE_RANK FIRST 表示对每个分区的有序行进行（连续）排名（对于排序列具有相同值的行将被赋予相同的排名）并丢弃所有未排名第一的行；最后 MIN(sal)对于每个分区的剩余行，返回最低工资。

在这种情况下，MIN 和 DENSE_RANK FIRST 都在 sal 列上运行，所以会做同样的事情，KEEP (DENSE_RANK FIRST ORDER BY sal) 是多余的。

但是，如果您使用不同的列作为最小值，那么您可以看到效果：

SQL Fiddle

Oracle 11g R2 架构设置：

CREATE TABLE test (name, sal, deptno) AS
SELECT 'a', 1, 1 FROM DUAL
UNION ALL SELECT 'b', 1, 1 FROM DUAL
UNION ALL SELECT 'c', 1, 1 FROM DUAL
UNION ALL SELECT 'd', 2, 1 FROM DUAL
UNION ALL SELECT 'e', 3, 1 FROM DUAL
UNION ALL SELECT 'f', 3, 1 FROM DUAL
UNION ALL SELECT 'g', 4, 2 FROM DUAL
UNION ALL SELECT 'h', 4, 2 FROM DUAL
UNION ALL SELECT 'i', 5, 2 FROM DUAL
UNION ALL SELECT 'j', 5, 2 FROM DUAL;

查询 1：

SELECT DISTINCT
  MIN(sal) KEEP (DENSE_RANK FIRST ORDER BY sal) OVER (PARTITION BY deptno) AS min_sal_first_sal,
  MAX(sal) KEEP (DENSE_RANK FIRST ORDER BY sal) OVER (PARTITION BY deptno) AS max_sal_first_sal,
  MIN(name) KEEP (DENSE_RANK FIRST ORDER BY sal) OVER (PARTITION BY deptno) AS min_name_first_sal,
  MAX(name) KEEP (DENSE_RANK FIRST ORDER BY sal) OVER (PARTITION BY deptno) AS max_name_first_sal,
  MIN(name) KEEP (DENSE_RANK LAST ORDER BY sal) OVER (PARTITION BY deptno) AS min_name_last_sal,
  MAX(name) KEEP (DENSE_RANK LAST ORDER BY sal) OVER (PARTITION BY deptno) AS max_name_last_sal,
  deptno
FROM test

Results：

| MIN_SAL_FIRST_SAL | MAX_SAL_FIRST_SAL | MIN_NAME_FIRST_SAL | MAX_NAME_FIRST_SAL | MIN_NAME_LAST_SAL | MAX_NAME_LAST_SAL | DEPTNO |
|-------------------|-------------------|--------------------|--------------------|-------------------|-------------------|--------|
|                 1 |                 1 |                  a |                  c |                 e |                 f |      1 |
|                 4 |                 4 |                  g |                  h |                 i |                 j |      2 |

【讨论】：

【参考方案2】：

在您的示例中，没有区别，因为您的聚合位于您正在排序的同一列上。 “KEEP”的真正意义/力量在于您对不同列进行聚合和排序。例如（借用另一个答案的“测试”表）...

SELECT deptno,  min(name) keep ( dense_rank first order by sal desc, name  ) ,
max(sal)
FROM test
group by deptno

;

此查询获取每个部门中薪水最高的人的姓名。考虑没有“KEEP”子句的替代方案：

SELECT deptno, name, sal
FROM test t
WHERE not exists ( SELECT 'person with higher salary in same department'
                                            FROM test t2  
                                            WHERE t2.deptno = t.deptno
                                            and ((  t2.sal > t.sal )
                                            OR ( t2.sal = t.sal AND t2.name < t.name ) ) )

KEEP 子句更简单、更高效（在这个简单的示例中，只有 3 个一致的 get 与 34 个备选方案）。

【讨论】：

是否在任何地方记录了 KEEP？ @matthew-mcpeak【参考方案3】：

详细说明@MT0 的回答中提到的一个区别：在您的第一个查询中，聚合函数 MIN 和 MAX 正在完成这项工作，而在第二个中，实际的行由 FIRST、LAST 和 KEEP 选择。

您甚至可以在第二个示例中将 MAX 替换为 MIN，它仍然会给出正确的答案（最高薪水）。

更多信息请参考以下 article。

【讨论】：

【参考方案4】：

如果您基于两列排序并获取其中一列或两列，这也很有帮助。

CREATE TABLE test (name, sal, deptno) AS
SELECT 'adam', 100, 1 FROM DUAL
UNION ALL SELECT 'bravo', 500, 1 FROM DUAL
UNION ALL SELECT 'coy', 456, 1 FROM DUAL
UNION ALL SELECT 'david', 50, 1 FROM DUAL
UNION ALL SELECT 'ethan', 50, 1 FROM DUAL
UNION ALL SELECT 'feral', 300, 1 FROM DUAL;

现在您要选择薪水最低的员工以及该人的薪水。条件是如果两个员工的最低薪水相同，则获取其姓名按字母顺序排在第一位的员工。

  select o.deptno
,min(o.sal) keep 
  (dense_rank first order by o.sal, o.name) least_salary
,min(o.name) keep 
  (dense_rank first order by o.sal, o.name) least_salary_person
 from test o
  group by 
 o.deptno;

输出：

DEPTNO  LEAST_SALARY    LEAST_SALARY_PERSON
1        50             david

【讨论】：

【参考方案5】：

此查询获取每个部门中薪水最高的人的姓名。

select MIN(ename),sal,deptno
from emp where sal in
   (
    select max(sal) from emp group by deptno
   )
GROUP BY sal,deptno;

【讨论】：

以上是关于在 Oracle 中使用和不使用 KEEP 进行分区的主要内容，如果未能解决你的问题，请参考以下文章

Oracle 插入、选择和不存在

Vue页面缓存和不缓存的方法

Oracle内存表的创建和使用

Oracle 数据库中对记录进行分页处理——学习笔记

用listagg怎么替代这个写法

使用 Oracle 进行分页