如何在where子句中使用max优化Oracle中的查询

Posted

技术标签:

【中文标题】如何在where子句中使用max优化Oracle中的查询【英文标题】:How to optimize query in Oracle with max in where clause 【发布时间】:2015-09-03 13:30:40 【问题描述】:

我提供假设的表格和查询来解释我的问题。请原谅我的任何语法错误。

部门表:

ID Dno Dname BDate   seq
1  1     A    5-Aug   0
2  1     B    3-Aug   0
3  1     B    7-Aug   1
4  1     C    2-Aug   0

以下查询返回上表中的第 1 条和第 3 条记录:

select * from Dept where BDate > (select mydate from other_table)
-- mydate is 4-Aug

然后我在查询中进行了以下更改以返回第二条记录。因为对于 Dname 'B',我们有一条 Bdate > 4-Aug 的记录。

select * from Dept D where
(SELECT MAX(BDATE)
FROM Dept D1
WHERE D1.Dno = D.Dno
AND D1.Dname = D.Dname
) > (select mydate from other_table)

上面的查询有效,但它影响了性能。我该如何优化它。

我想到了联合或移动最大查询来选择部分。但是,找不到方法。

【问题讨论】:

【参考方案1】:

假设我正确理解了您的逻辑(如果最大日期大于指定日期,您希望给定 dno 和 dname 的所有行)并且检索“mydate”的查询返回单行,我会这样做类似:

with     dept as (select 1 id, 1 dno, 'A' dname, to_date('05/08/2015', 'dd/mm/yyyy') bdate, 0 seq from dual union all
                  select 2 id, 1 dno, 'B' dname, to_date('03/08/2015', 'dd/mm/yyyy') bdate, 0 seq from dual union all
                  select 3 id, 1 dno, 'B' dname, to_date('07/08/2015', 'dd/mm/yyyy') bdate, 0 seq from dual union all
                  select 4 id, 1 dno, 'C' dname, to_date('02/08/2015', 'dd/mm/yyyy') bdate, 0 seq from dual),
  other_table as (select to_date('04/08/2015', 'dd/mm/yyyy') mydate from dual)
select id,
       dno,
       dname,
       bdate,
       seq
from   (select d.*,
               max(bdate) over (partition by dno, dname) max_bdate
        from   dept d)
where  max_bdate > (select mydate from other_table);

        ID        DNO DNAME BDATE             SEQ
---------- ---------- ----- ---------- ----------
         1          1 A     05/08/2015          0
         2          1 B     03/08/2015          0
         3          1 B     07/08/2015          0

【讨论】:

它可以工作,但需要更长的时间。和解释计划成本是 373037。解释计划成本是 86831 与问题中提到的查询。 我不会太在意比较不同查询的成本。如果这个查询的性能不如另一个,那就不要使用它! *:-)【参考方案2】:

如果您希望此查询返回DEPT 表中的一小部分行,这对您来说可能更快。我假设DEPT.DNAME 是唯一的,并且上面有一个索引。 (当然,DEPT.BDATE 上需要有一个索引!)

with     dept as (select 1 id, 1 dno, 'A' dname, to_date('05/08/2015', 'dd/mm/yyyy') bdate, 0 seq from dual union all
                  select 2 id, 1 dno, 'B' dname, to_date('03/08/2015', 'dd/mm/yyyy') bdate, 0 seq from dual union all
                  select 3 id, 1 dno, 'B' dname, to_date('07/08/2015', 'dd/mm/yyyy') bdate, 0 seq from dual union all
                  select 4 id, 1 dno, 'C' dname, to_date('02/08/2015', 'dd/mm/yyyy') bdate, 0 seq from dual),
  other_table as (select to_date('04/08/2015', 'dd/mm/yyyy') mydate from dual)
select id,
       dno,
       dname,
       bdate,
       seq
from   dept WHERE dname IN ( SELECT d2.dname FROM dept d2 WHERE d2.bdate >  (select mydate from other_table) );

【讨论】:

【参考方案3】:

以下查询运行速度快 4 倍,结果正确:

select d1.* from Dept d1,
(select dno, dname, MAX(BDATE) as maxdate from Dept group by dno, dname) d2
where
d1.dno=d2.dno and d1.dname=d2.dname
and d2.maxdate > (select mydate from other_table)

【讨论】:

【参考方案4】:

使用 group-by 子句避免子查询之一:

select Dno, Dname, max(BDate)
from Dept
group by Dno, Dname
having Max(BDate) > (select mydate from other_table)

您还可以使用本地 var 删除其他子查询:

declare @mydate Date = (select mydate from other_table);
select Dno, Dname, max(BDate)
from Dept
group by Dno, Dname
having Max(BDate) > (@mydate)

【讨论】:

第二个查询对于 Oracle 来说是无效的 SQL。 @MTO - 谢谢,我不是 Oracle 人员,但这就是我在 MS-SQL 中的做法。 在实际场景中,我有很多列,所以我认为将 50 列左右分组不会提高性能。 @Vikas - 哇... 50 列。首先,您不需要使用所有可用的列,只需使用相关列进行选择和分组。或者第二,考虑重构您的架构以将员工数据分解到一个单独的表中,将其从您的部门表中删除。 (我在这里做了一些假设)。 以上查询不能作为最大分组功能在 where 子句中使用。将其移动到有子句时,查询仅返回第 1 条和第 3 条记录,而不是第 2 条记录。【参考方案5】:

根据数据集的选择性,可能值得尝试这种方法:

select *
from   dept
where  (dno, dname) in (
         select distinct dno, dname
         from   dept
         where  BDATE > (select mydate from other_table))

使用 dept(bdate) 和 dept(dno,dname) 上的索引,并且只有很少的记录要匹配,这将非常快。

【讨论】:

以上是关于如何在where子句中使用max优化Oracle中的查询的主要内容,如果未能解决你的问题,请参考以下文章

在oracle中where 子句和having子句中的区别

oracle 性能优化建议

Oracle查询性能优化

Oracle 查询性能优化(转)

Oracle初级优化sql

Oracle 优化相关