沃趣科技执行计划-5:第一个子操作的变化
Posted woqutechteam
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了沃趣科技执行计划-5:第一个子操作的变化相关的知识,希望对你有一定的参考价值。
沃趣科技作为国内领先的数据库云平台解决方案提供商,一直致力于企业级数据库云平台产品的研发,为用户提供高性能、高可用、可扩展的的数据库云环境及不同业务场景需求的数据库平台,满足客户对极致性能、数据安全、容灾备份、业务永续等需求。沃趣科技凭借专业的团队,优质的产品,前沿的技术,贴心的服务赢得了客户的信任与尊重,也获得了市场的认同。
我提出了“子操作按先后顺序执行,递归向下”的解释执行计划的基本策略,但是这并不是一个完美的规则,即使遵循基本的“子操作按先后顺序执行”,也很容易对执行过程中发生的事情产生错误判断。
在这部分中,我们将看到几个例子,其中我们仍将在某些情况下使用“子操作按先后顺序执行”,一个BUG的例子使规则看起来是错误的,还有一个示例不适用“子操作按先后顺序执行”。实际上,有几种不同的情况并不适用该规则,但是我们必须等到第6部分才能了解更多的情况。
子查询更新
这篇文章中介绍的例子如下:更新,select列表中的标量子查询和子查询分解。为了涵盖尽可能多的例子,我将提供一个带有计划的示例语句并给出一些注释;我不会提供重新创建表和数据的完整代码。
第一个例子是带有子查询的更新:部分原因是DML计划很少出现在执行计划的文本中,另一部分原因是可以将它与我的第二个示例进行对比。示例语句:
update t1 set
n1 = (
select max(mod100)
from t2
where t2.id = t1.id
),
n2 = (
select max(trunc100)
from t3
where t3.id = t1.id
)
where
id between 101 and 200
;
这个语句有三个直观的步骤。第一我们需要找到更新的行,对每一行,我们执行t2的子查询,之后是t3的子查询。所以执行计划如下所示:
---------------------------------------------------------------------------------------
| Id | Operation |Name | Rows | Bytes | Cost (%CPU)| Time |
---------------------------------------------------------------------------------------
| 0 | UPDATE STATEMENT | | 101 | 1212 | 610 (34)| 00:00:04 |
| 1 | UPDATE |T1 | | | | |
|* 2 | INDEX RANGE SCAN | T1_I1 | 101 | 1212 | 2 (0)|00:00:01 |
| 3 | SORT AGGREGATE | | 1 | 7 | | |
| 4 | FIRST ROW | | 1 | 7 | 2 (0)| 00:00:01|
|* 5 | INDEX RANGE SCAN (MIN/MAX)|T2_I1 | 1 | 7 | 2 (0)| 00:00:01 |
| 6 | SORT AGGREGATE | | 1 | 7 | | |
| 7 | FIRST ROW | | 1 | 7 | 2 (0)| 00:00:01|
|* 8 | INDEX RANGE SCAN (MIN/MAX)|T3_I1 | 1 | 7 | 2 (0)| 00:00:01 |
---------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
2 - access("ID">=101 AND"ID"<=200)
5 - access("T2"."ID"=:B1)
8 - access("T3"."ID"=:B1)
就像你看到的,这个计划遵循了“子操作按先后顺序执行”。第1行的更新操作有三个子操作:第2,3和6行。第一个子操作INDEX RANGE SCAN(索引范围扫描)帮助我们找到需要更新的行的rowid,第二个子操作生成的子计划(3-5行)表示子查询更新列n1,第三个子操作生成的子计划(6-8行)表示子查询更新列n2。
标量子查询
对于第二个例子,我将把这个语句转换成一个查询语句,该查询显示更新操作将如何更改数据。我所要做的就是从更新语句中获取每个子查询,并将其作为一个标量子查询加入select列表中。在这个例子中,我们看到“子操作按先后顺序执行”规则几乎被颠倒过来:
select
n1, n2,
(
select max(mod100)
from t2
where t2.id = t1.id
) new_n1,
(
select max(trunc100)
from t3
where t3.id = t1.id
) new_n2
from
t1
where
t1.id between 101 and 200
;
--------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 101 | 1212 | 4 (0)| 00:00:01 |
| 1 | SORT AGGREGATE | | 1 | 7 | | |
| 2 | FIRST ROW | | 1 | 7 | 2 (0)| 00:00:01 |
|* 3 | INDEX RANGE SCAN (MIN/MAX)| T2_I1 | 1 | 7 | 2 (0)| 00:00:01 |
| 4 | SORT AGGREGATE | | 1 | 7 | | |
| 5 | FIRST ROW | | 1 | 7 | 2 (0)| 00:00:01 |
|* 6 | INDEX RANGE SCAN (MIN/MAX)| T3_I1 | 1 | 7 | 2 (0)| 00:00:01 |
| 7 | TABLE ACCESS BY INDEX ROWID | T1 | 101 | 1212 | 4 (0)| 00:00:01 |
|* 8 | INDEX RANGE SCAN | T1_I1 | 101 | | 2 (0)| 00:00:01 |
--------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
3 - access("T2"."ID"=:B1)
6 - access("T3"."ID"=:B1)
8 - access("T1"."ID">=101 AND "T1"."ID"<=200)
这个计划中可以看出,第0行的select语句有3个子查询(1,4,7行),但是,当我们直观感觉肯定会发生的跟实际发生的子操作的顺序做比较,我们会看到,最后一个子操作代表了驱动查询语句的起点。当你语句的select列表中有标量子查询时,最后一个子操作会被当作第一个子操作进行调用,剩下的表示标量子查询的子操作,会按照顺序被调用。
BUG演示
编写越来越复杂的SQL是不可避免的,只需要一点小改动就能命中与标量子查询相关的显示错误—如果我们想根据表t2的数据更新t1里的某些行,并根据表t3更新t1里的其他行,我们可能会使用decode()来实现。这里有一个查询语句用来演示原理和相关bug:
select
n1,
decode(mod(n1,4),
0, (
select max(mod100)
from t2
where t2.id = t1.id
),
(
select max(trunc100)
from t3
where t3.id = t1.id
)
)
from
t1
where
t1.id between 101 and 200
;
-----------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
-----------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 101 | 808 | 4 (0)| 00:00:01 |
| 1 | SORT AGGREGATE | | 1 | 7 | | |
| 2 | FIRST ROW | | 1 | 7 | 2 (0)| 00:00:01 |
|* 3 | INDEX RANGE SCAN (MIN/MAX) | T2_I1 | 1 | 7 | 2 (0)| 00:00:01 |
| 4 | SORT AGGREGATE | | 1 | 7 | | |
| 5 | FIRST ROW | | 1 | 7 | 2 (0)| 00:00:01 |
|* 6 | INDEX RANGE SCAN (MIN/MAX)| T3_I1 | 1 | 7 | 2 (0)| 00:00:01 |
| 7 | TABLE ACCESS BY INDEX ROWID | T1 | 101 | 808 | 4 (0)| 00:00:01 |
|* 8 | INDEX RANGE SCAN | T1_I1 | 101 | | 2 (0)| 00:00:01 |
-----------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
3 - access("T2"."ID"=:B1)
6 - access("T3"."ID"=:B1)
8 - access("T1"."ID">=101 AND "T1"."ID"<=200)
这个查询语句中,如果n1是4的倍数则返回t2中的值,否则返回t3的值。我们有理由相信这两个子查询在某些方面是“相同的”,但是当我们查看执行计划时,情况就不一样了。
我们首先可以看到最后一个子操作是作为驱动这条查询语句出现的,但是注意这个查询语句只剩下另外一个子操作,如果我们运用基本规则,我们很显然能看到,对t3的子查询似乎是对t2子查询的一个子操作。这告诉我们我们必须先执行4-6行生成rowsource,之后才能把结果集向上传递给3,2和1行。
我们很容易就能写出另外一个类似这种执行计划的查询语句,但是我要说的是,这个执行计划的执行顺序是错误的。(12c中也是相同的执行计划,也同样是错误的)
我更早的部分中我解释过,Oracle会对计划中的每一行计算depth,我们可以从plan table(或动态性能是图)中选择该列生成执行计划的缩进,但是有时候优化器会计算错误的depth值。上面的例子就是其中一种情况,我们需要使用自己的代码(对parent_id和id列执行connectby查询)来生成正确的执行计划。
我使用了比写查询代码更简单的方法来展示正确的执行计划。用sql_tract跟踪sql执行过程并用tkprod对trace文件格式化。这里是结果:
Rows (1st) Row Source Operation
---------- ---------------------------------------------------
25 SORT AGGREGATE (cr=11 pr=0 pw=0 time=126 us)
25 FIRST ROW (cr=11 pr=0 pw=0 time=83 us cost=2 size=7 card=1)
25 INDEX RANGE SCAN (MIN/MAX) T2_I1 (cr=11 pr=0 pw=0 time=74 us cost=2 size=7 card=1)
75 SORT AGGREGATE (cr=11 pr=0 pw=0 time=241 us)
75 FIRST ROW (cr=11 pr=0 pw=0 time=166 us cost=2 size=7 card=1)
75 INDEX RANGE SCAN (MIN/MAX) T3_I1 (cr=11 pr=0 pw=0 time=140 us cost=2 size=7 card=1)
100 TABLE ACCESS BY INDEX ROWID T1 (cr=13 pr=0 pw=0 time=82 us cost=4 size=808 card=101)
100 INDEX RANGE SCAN T1_I1 (cr=6 pr=0 pw=0 time=654 us cost=2 size=0 card=101)
从这个输出中可以看到,这两个子查询在select语句中是相等的,就像前面的select语句中一样。trace文件中不包含depth信息;它的STAT行只包含id跟parent_id,所以tkprod必须获取深度并给我们提供了正确的执行计划。
tkprof输出中另一个有用的特性是,我们可以通过”Rows(1st)”列看到对t2的子查询一共返回了25行,对t3的子查询一共返回了75行。
回顾最初的查询,我们期望(或希望)一个查询运行25次,其他查询运行75次,因此在这个例子中,我们有一些确证的证据。
Note:实际上,在输出中我们并没有足够的信息来了解实际情况—我们根据我们对数据以及查询的理解直接跳到了结论:原则上所有的子查询可能都执行了100次,分别返回了25%和75%的数据,我们实际上需要内部视图v$sql_plan_statistics中”starts”的统计信息,但是如果我们通过dbms_xplan查询这个视图,它同样会生成错误的执行计划,这也是我们为什么不使用connectby查询的原因,所以我们必须从这两个地方(正确的统计信息和正确的执行路径)去获取正确的执行计划。
子查询分解
我提出12c会使用新的转换将标量子查询转换为连接。让我们回到前面的查询—包含两个简单内联标量子查询的查询,并在11g中模拟这个计划。我们可以这么做:
with sq2 as (
select /*+ materialize */
t2.id, max(t2.mod100) new_n1
from t2
where t2.id between 101 and 200
group by t2.id
),
sq3 as (
select /*+ materialize */
t3.id, max(t3.trunc100) new_n2
from t3
where t3.id between 101 and 200
group by t3.id
)
select
t1.n1, t1.n2,
sq2.new_n1,
sq3.new_n2
from
t1, sq2, sq3
where
t1.id between 101 and 200
and sq2.id(+) = t1.id
and sq3.id(+) = t1.id
;
-----------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
-----------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 101 | 6464 | 12 (0)| 00:00:01 |
| 1 | TEMP TABLE TRANSFORMATION | | | | | |
| 2 | LOAD AS SELECT | SYS_TEMP | | | | |
| 3 | SORT GROUP BY NOSORT | | 101 | 707 | 2 (0)| 00:00:01 |
|* 4 | INDEX RANGE SCAN | T2_I1 | 101 | 707 | 2 (0)| 00:00:01 |
| 5 | LOAD AS SELECT | SYS_TEMP | | | | |
| 6 | SORT GROUP BY NOSORT | | 101 | 707 | 2 (0)| 00:00:01 |
|* 7 | INDEX RANGE SCAN | T3_I1 | 101 | 707 | 2 (0)| 00:00:01 |
|* 8 | HASH JOIN OUTER | | 101 | 6464 | 8 (0)| 00:00:01 |
|* 9 | HASH JOIN OUTER | | 101 | 3838 | 6 (0)| 00:00:01 |
| 10 | TABLE ACCESS BY INDEX ROWID| T1 | 101 | 1212 | 4 (0)| 00:00:01 |
|*11 | INDEX RANGE SCAN | T1_I1 | 101 | | 2 (0)| 00:00:01 |
|*12 | VIEW | | 101 | 2626 | 2 (0)| 00:00:01 |
| 13 | TABLE ACCESS FULL | SYS_TEMP | 101 | 707 | 2 (0)| 00:00:01 |
|*14 | VIEW | | 101 | 2626 | 2 (0)| 00:00:01 |
| 15 | TABLE ACCESS FULL | SYS_TEMP | 101 | 707 | 2 (0)| 00:00:01 |
-----------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
4 - access("T2"."ID">=101 AND "T2"."ID"<=200)
7 - access("T3"."ID">=101 AND "T3"."ID"<=200)
8 - access("SQ3"."ID"(+)="T1"."ID")
9 - access("SQ2"."ID"(+)="T1"."ID")
11 - access("T1"."ID">=101 AND "T1"."ID"<=200)
12 - filter("SQ2"."ID"(+)>=101 AND "SQ2"."ID"(+)<=200)
14 - filter("SQ3"."ID"(+)>=101 AND "SQ3"."ID"(+)<=200)
我在子查询分解中使用hint/*+ materialize*/强制Oracle建立了两张内部全局临时表,表中包含t2和t3中我们所需要的结果,之后剩下的代码就是将t1和两个结果集做外连接。实际上我可以去掉hint,Oracle会将“分解的子查询”进行内联复制,从而产生一组类似与两个聚合结果集进行outer hash join的结果集,并保存在会话内存的工作区中。我使用materialize选项只是为了显示带有物化子查询的计划。如果我们将执行计划简化下,那么我们会看到如下:
-----------------------------------------------------------------------------------------
| Id | Operation |Name | Rows | Bytes | Cost (%CPU)| Time |
-----------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 101 | 6464| 12 (0)| 00:00:01 |
| 1 | TEMP TABLE TRANSFORMATION | | | | | |
| 2 | LOAD AS SELECT |SYS_TEMP | | | | |
| 5 | LOAD AS SELECT |SYS_TEMP | | | | |
|* 8 | HASH JOIN OUTER | | 101 | 6464| 8 (0)| 00:00:01 |
-----------------------------------------------------------------------------------------
我想说这并不是我想看到的顺序,我更想看到第8行(hash join)作为第0行(select statement)的一个子操作。我们可以看到计划中三个主要的阶段都是temptable transormation的子操作,我们先创建了两张临时表,之后做hash join。如果我们展开第2行,我们看到的是聚合表t2;如果我们展开第5行,我们看到的是聚合表t3;如果我们展开第8行,我们看到的是t1和两个临时表之间的hashjoin。
-----------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
-----------------------------------------------------------------------------------------
|* 8 | HASH JOIN OUTER | | 101 | 6464 | 8 (0)| 00:00:01 |
|* 9 | HASH JOIN OUTER | | 101 | 3838 | 6 (0)| 00:00:01 |
| 10 | TABLE ACCESS BY INDEX ROWID| T1 | 101 | 1212 | 4 (0)| 00:00:01 |
|*12 | VIEW | | 101 | 2626 | 2 (0)| 00:00:01 |
|*14 | VIEW | | 101 | 2626 | 2 (0)| 00:00:01 |
-----------------------------------------------------------------------------------------
除了计划中执行查询被向右移动了一点外,在我们真正执行查询前可能会生成很多数据,就像我们计划中在select列表中的标量子查询一样,在子查询中仍然遵循基本规则,可以简单地通过折叠多余的文本进行分析,直到可以看到计划中每个操作的第一个操作为止。
结 论
第5部分我们看了一些例子,基本都是关于一个大查询中包含一些子查询,来观察”子操作按先后顺序执行,递归向下”这个规则是怎么在复杂的查询中输出的。我们也检查了我们已经找到的一个BUG,这也告诉我们不能盲目的遵循规则,必要时需要交叉引用查询生成执行计划的其他方式来获得正确的计划。我们同样也看了一些标量子查询的特殊例子,作为驱动查询的操作往往都是最后一个子操作。
在下一部分,我们将看到一些查询案例,其中优化器执行的子查询确实打破了“子操作按先后顺序执行,递归向下“的规则,并使你完全错误的理解执行计划。
原文链接:
https://www.red-gate.com/simple-talk/sql/oracle/execution-plans-part-5-first-child-variations/
原文作者:Jonathan Lewis
| 译者简介
林锦森·沃趣科技数据库技术专家
沃趣科技数据库工程师,多年从事Oracle数据库,较丰富的故障处理、性能调优、数据迁移及备份恢复经验。
以上是关于沃趣科技执行计划-5:第一个子操作的变化的主要内容,如果未能解决你的问题,请参考以下文章