Oracle如何处理SQL中的存储函数调用?
Posted
技术标签:
【中文标题】Oracle如何处理SQL中的存储函数调用?【英文标题】:How does Oracle process stored function calls in SQL? 【发布时间】:2010-09-07 08:29:08 【问题描述】:伙计们。说,我有一个问题:
select t.value, my_stored_function(t.value)
from my_table t
where my_stored_function(t.value) = n_Some_Required_Value
我用以下方式重写了它:
select value, func_value
from (select t.value, my_stored_function(t.value) func_value
from my_table t) subquery
where subquery.func_value = n_Some_Required_Value
让我们将my_stored_function
视为资源消耗。我假设,在第二个查询中,它的调用次数减少了两次,但在此更改后我没有体验到任何显着的性能提升。
所以,我想,我的假设是错误的。那么 Oracle 究竟是如何处理这些函数调用的呢?
【问题讨论】:
【参考方案1】:这是一个非常好的问题。
我首先尝试创建表并插入示例数据(仅五行):
create table my_table(value number);
insert into my_table(value) values(1);
insert into my_table(value) values(2);
insert into my_table(value) values(3);
insert into my_table(value) values(4);
insert into my_table(value) values(5);
我做了一个简单的测试包来测试这个。
create or replace package my_package is
g_counter_SELECT PLS_INTEGER := 0; -- counter for SELECT statement
g_counter_WHERE PLS_INTEGER := 0; -- counter for WHERE clause
function my_function(number_in in number, type_in in varchar2) return number;
procedure reset_counter;
end;
/
还有身体……
create or replace package body my_package is
function my_function(number_in in number, type_in in varchar2) return number is
begin
IF(type_in = 'SELECT') THEN
g_counter_SELECT := g_counter_SELECT + 1;
ELSIF(type_in = 'WHERE') THEN
g_counter_WHERE := g_counter_WHERE + 1;
END IF;
return mod(number_in, 2);
end;
procedure reset_counter is
begin
g_counter_SELECT := 0;
g_counter_WHERE := 0;
end;
end;
/
现在,我们可以在 Oracle 9i 上运行测试(在 11g 上是相同的结果):
-- reset counter
exec my_package.reset_counter();
-- run query
select t.value, my_package.my_function(t.value, 'SELECT')
from my_table t
where my_package.my_function(t.value, 'WHERE') = 1;
-- print result
exec dbms_output.put_line('Count (SELECT) = ' || my_package.g_counter_SELECT);
exec dbms_output.put_line('Count (WHERE) = ' || my_package.g_counter_WHERE);
结果是:
DBMS Output (Session: [1] SCOTT@ORA9i at: 08.09.2010 01:50:04):
-----------------------------------------------------------------------
Count (SELECT) = 3
Count (WHERE) = 5
这是计划表:
--------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost |
--------------------------------------------------------------------
| 0 | SELECT STATEMENT | | | | |
|* 1 | TABLE ACCESS FULL | MY_TABLE | | | |
--------------------------------------------------------------------
这意味着该函数(在 WHERE 计算中)为表的每一行调用(在 FULL TABLE SCAN 的情况下)。在 SELECT 语句启动时,只要符合条件 WHERE my_function = 1
现在...测试您的第二个查询(在 Oracle9i 和 11g 上的结果相同)
结果是:
DBMS Output (Session: [1] SCOTT@ORA9i at: 08.09.2010 02:08:04):
-----------------------------------------------------------------------
Count (SELECT) = 8
Count (WHERE) = 0
解释如下所示(对于 CHOOSE 优化器模式):
--------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost |
--------------------------------------------------------------------
| 0 | SELECT STATEMENT | | | | |
|* 1 | TABLE ACCESS FULL | MY_TABLE | | | |
--------------------------------------------------------------------
问题是:为什么计数 (SELECT) = 8?
因为 Oracle 首先运行子查询(在我使用 FULL TABLE SCAN 的情况下,它是 5 行 = 5 在 SELECT 语句中调用 my_function):
select t.value, my_package.my_function(t.value, 'SELECT') func_value from my_table t
对于这个视图(子查询就像视图)运行 3 次(由于 subquery.func_value = 1 的条件)再次调用函数 my_function。
个人不建议在WHERE子句中使用函数,但我承认有时这是不可避免的。
以下是最糟糕的例子:
select t.value, my_package.my_function(t.value, 'SELECT')
from my_table t
where my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE')
and my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE')
and my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE')
and my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE')
and my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE');
Oracle 9i 上的结果在哪里:
Count (SELECT) = 5
Count (WHERE) = 50
在 Oracle 11g 上是:
Count (SELECT) = 5
Count (WHERE) = 5
在这种情况下,这表明有时函数的使用可能对性能至关重要。在其他情况下(11g)它解决了数据库本身。
【讨论】:
哈!有趣的是,如果我查询`select t1.value from (select t.value, my_package.my_function(t.value, 'WHERE') fv from my_table t) t1 where t1.fv = 1`(实际上没有列出我在输出字段中的fv
列) - 它保持在五个。我认为 oracle 只是将子查询级别的函数调用结果传播到上层,它确实如此,但以一种非常奇怪的方式。 where t1.fv = 1
不会再次调用函数,但在选定列的列表中列出 t1.fv
会。
是的,最好的解决方案是:select t.value, n_Some_Required_Value from my_table t where my_stored_function(t.value) = n_Some_Required_Value;
问题是,实际上我必须检查my_stored_function
是否不等于零并输出它的实际值,如果不是:))
那又如何(在 WHERE 中使用它而不使用函数):... where case when t.value != 0 then t.value else 0 end;
在这个测试中,您使用了函数的第二个参数来区分这两个调用。因此,这不是对两个调用相同时可能发生的情况的有效测试。【参考方案2】:
在这两种情况下,my_table
中的每一行都会调用一次该函数。在第一种情况下,调用将是where
子句的结果,并且它刚刚找到的值将被返回而无需再次计算。在第二种情况下,所有计算值都将从子查询返回,然后由外部查询的where
子句过滤。
编辑:根据 Martin 的测试显然不是真的。现在我必须回去找到我多年前所做的测试,让我认为是这种情况,看看我做错了什么。关于联邦调查局的那一点仍然是真实的。我希望。
在内存使用和优化器使用的确切计划方面可能存在一些细微差别,但我认为两者都不重要。几乎可以肯定,这与函数调用本身的成本无关。
我认为优化它的唯一方法是使用基于函数的索引。
【讨论】:
为了使基于函数的索引成为可能,存储的函数必须是确定性的。【参考方案3】:一个简单的测试:
create or replace function print_function(v1 number) return number is
begin
dbms_output.put_line(v1);
return v1;
end;
/
select print_function(ASCII(dummy)) as test
from dual
where chr(print_function(ASCII(dummy))) = dummy;
结果(使用 10g):
TEST
----------
88
88
88
结论:函数在SELECT和WHERE子句中分别执行。
【讨论】:
【参考方案4】:您可以使用 PL/SQL pragma 来影响 oracle 优化查询的方式,请参阅RESTRICT_REFERENCES Pragma
【讨论】:
以上是关于Oracle如何处理SQL中的存储函数调用?的主要内容,如果未能解决你的问题,请参考以下文章