Oracle如何处理SQL中的存储函数调用?

Posted

技术标签:

【中文标题】Oracle如何处理SQL中的存储函数调用?【英文标题】:How does Oracle process stored function calls in SQL? 【发布时间】:2010-09-07 08:29:08 【问题描述】:

伙计们。说,我有一个问题:

select t.value, my_stored_function(t.value)
  from my_table t
 where my_stored_function(t.value) = n_Some_Required_Value

我用以下方式重写了它:

select value, func_value
  from (select t.value, my_stored_function(t.value) func_value 
          from my_table t) subquery
 where subquery.func_value = n_Some_Required_Value

让我们将my_stored_function 视为资源消耗。我假设,在第二个查询中,它的调用次数减少了两次,但在此更改后我没有体验到任何显着的性能提升。

所以,我想,我的假设是错误的。那么 Oracle 究竟是如何处理这些函数调用的呢?

【问题讨论】:

【参考方案1】:

这是一个非常好的问题。

我首先尝试创建表并插入示例数据(仅五行):

create table my_table(value number);
insert into my_table(value) values(1);
insert into my_table(value) values(2);
insert into my_table(value) values(3);
insert into my_table(value) values(4);
insert into my_table(value) values(5);

我做了一个简单的测试包来测试这个。

create or replace package my_package is
  g_counter_SELECT PLS_INTEGER := 0; -- counter for SELECT statement
  g_counter_WHERE  PLS_INTEGER := 0; -- counter for WHERE clause
  function my_function(number_in in number, type_in in varchar2) return number;
  procedure reset_counter;
end;
/

还有身体……

create or replace package body my_package is
  function my_function(number_in in number, type_in in varchar2) return number is
  begin
    IF(type_in = 'SELECT') THEN
        g_counter_SELECT := g_counter_SELECT + 1;
    ELSIF(type_in = 'WHERE') THEN
        g_counter_WHERE := g_counter_WHERE + 1;
    END IF;
    return mod(number_in, 2);
  end;
  procedure reset_counter is
  begin
    g_counter_SELECT := 0;
    g_counter_WHERE := 0;
  end;
end;
/

现在,我们可以在 Oracle 9i 上运行测试(在 11g 上是相同的结果):

-- reset counter
exec my_package.reset_counter();

-- run query
select t.value, my_package.my_function(t.value, 'SELECT')
  from my_table t
 where my_package.my_function(t.value, 'WHERE') = 1;

-- print result
exec dbms_output.put_line('Count (SELECT) = ' || my_package.g_counter_SELECT);
exec dbms_output.put_line('Count (WHERE) = ' || my_package.g_counter_WHERE);

结果是:

DBMS Output (Session: [1] SCOTT@ORA9i at: 08.09.2010 01:50:04): 
-----------------------------------------------------------------------
Count (SELECT) = 3
Count (WHERE) = 5

这是计划表:

--------------------------------------------------------------------
| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |
--------------------------------------------------------------------
|   0 | SELECT STATEMENT     |             |       |       |       |
|*  1 |  TABLE ACCESS FULL   | MY_TABLE    |       |       |       |
--------------------------------------------------------------------

这意味着该函数(在 WHERE 计算中)为表的每一行调用(在 FULL TABLE SCAN 的情况下)。在 SELECT 语句启动时,只要符合条件 WHERE my_function = 1

现在...测试您的第二个查询(在 Oracle9i 和 11g 上的结果相同)

结果是:

DBMS Output (Session: [1] SCOTT@ORA9i at: 08.09.2010 02:08:04): 
-----------------------------------------------------------------------
Count (SELECT) = 8
Count (WHERE) = 0

解释如下所示(对于 CHOOSE 优化器模式):

--------------------------------------------------------------------
| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |
--------------------------------------------------------------------
|   0 | SELECT STATEMENT     |             |       |       |       |
|*  1 |  TABLE ACCESS FULL   | MY_TABLE    |       |       |       |
--------------------------------------------------------------------

问题是:为什么计数 (SELECT) = 8?

因为 Oracle 首先运行子查询(在我使用 FULL TABLE SCAN 的情况下,它是 5 行 = 5 在 SELECT 语句中调用 my_function):

select t.value, my_package.my_function(t.value, 'SELECT') func_value from my_table t

对于这个视图(子查询就像视图)运行 3 次(由于 subquery.func_value = 1 的条件)再次调用函数 my_function。

个人不建议在WHERE子句中使用函数,但我承认有时这是不可避免的。

以下是最糟糕的例子:

select t.value, my_package.my_function(t.value, 'SELECT')
  from my_table t
 where my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE')
   and my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE')
   and my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE')
   and my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE')
   and my_package.my_function(t.value, 'WHERE') = my_package.my_function(t.value, 'WHERE');

Oracle 9i 上的结果在哪里

Count (SELECT) = 5
Count (WHERE) = 50

在 Oracle 11g 上是

Count (SELECT) = 5
Count (WHERE) = 5

在这种情况下,这表明有时函数的使用可能对性能至关重要。在其他情况下(11g)它解决了数据库本身。

【讨论】:

哈!有趣的是,如果我查询`select t1.value from (select t.value, my_package.my_function(t.value, 'WHERE') fv from my_table t) t1 where t1.fv = 1`(实际上没有列出我在输出字段中的fv 列) - 它保持在五个。我认为 oracle 只是将子查询级别的函数调用结果传播到上层,它确实如此,但以一种非常奇怪的方式。 where t1.fv = 1 不会再次调用函数,但在选定列的列表中列出 t1.fv 会。 是的,最好的解决方案是:select t.value, n_Some_Required_Value from my_table t where my_stored_function(t.value) = n_Some_Required_Value; 问题是,实际上我必须检查my_stored_function 是否不等于零并输出它的实际值,如果不是:)) 那又如何(在 WHERE 中使用它而不使用函数):... where case when t.value != 0 then t.value else 0 end; 在这个测试中,您使用了函数的第二个参数来区分这两个调用。因此,这不是对两个调用相同时可能发生的情况的有效测试。【参考方案2】:

在这两种情况下,my_table 中的每一行都会调用一次该函数。在第一种情况下,调用将是where 子句的结果,并且它刚刚找到的值将被返回而无需再次计算。在第二种情况下,所有计算值都将从子查询返回,然后由外部查询的where 子句过滤。

编辑:根据 Martin 的测试显然不是真的。现在我必须回去找到我多年前所做的测试,让我认为是这种情况,看看我做错了什么。关于联邦调查局的那一点仍然是真实的。我希望。

在内存使用和优化器使用的确切计划方面可能存在一些细微差别,但我认为两者都不重要。几乎可以肯定,这与函数调用本身的成本无关。

我认为优化它的唯一方法是使用基于函数的索引。

【讨论】:

为了使基于函数的索引成为可能,存储的函数必须是确定性的。【参考方案3】:

一个简单的测试:

create or replace function print_function(v1 number) return number is
begin
   dbms_output.put_line(v1);
   return v1;
end;
/

select print_function(ASCII(dummy)) as test
  from dual
 where chr(print_function(ASCII(dummy))) = dummy;

结果(使用 10g):

      TEST
----------
        88

88
88

结论:函数在SELECT和WHERE子句中分别执行。

【讨论】:

【参考方案4】:

您可以使用 PL/SQL pragma 来影响 oracle 优化查询的方式,请参阅RESTRICT_REFERENCES Pragma

【讨论】:

以上是关于Oracle如何处理SQL中的存储函数调用?的主要内容,如果未能解决你的问题,请参考以下文章

使用 sum 函数时如何处理 Store 中的空值

如何处理 Oracle APEX 报告中的复选框项目?

如何处理完成闭包中的多个错误

Oracle 如何处理给定的 SQL 语句

如何处理我的 JavaScript 作业? [关闭]

如何处理 SQL 数据库中的 RAISERROR