带有子查询的 Oracle 数据透视

Posted

技术标签:

【中文标题】带有子查询的 Oracle 数据透视【英文标题】:Oracle pivot with subquery 【发布时间】:2013-10-18 08:52:50 【问题描述】:

我在 Oracle PL SQL Developer 中使用如下所示的数据透视:

SELECT *
FROM population
PIVOT (AVG(Total) for Data_Type IN ('Group1','Group2','Group3'))

这很好用,但我不想每次添加新列或更改一个列(即 Group4、5、6 等)时都必须进行编辑,所以我尝试了如下子查询:

SELECT *
FROM population
PIVOT (AVG(Total) for Data_Type IN (SELECT Data_Type FROM population))

这会导致以下错误:ORA-00936:缺少表达式。

经过一番研究,看来我可以用 XML 生成结果,所以我尝试了以下方法:

SELECT *
FROM population
PIVOT XML(AVG(Total) for Data_Type IN (ANY))

这实际上生成了所需的数据,但是是 XML 格式的。所以我的问题是,如何在 PL SQL Developer 中将 XML 结果转换为标准表格格式?或者,如果我想将生成的 XML 文件导入 Crystal Reports 之类的工具中,我需要为这些结果创建一个模式文件。是不是很容易在 SQL 中自动生成?

【问题讨论】:

【参考方案1】:

您会考虑使用 PIPELINED 功能来实现您的目标吗?

我已经写了一个这样的函数的例子。该示例基于 Tom Kyte 的文章中的表格、示例数据和 PIVOT 查询,您可以在他的网站上找到:

Tom Kyte's article about PIVOT/UNPIVOT

Tom Kyte's article about PIPELINED functions

该示例的工作原理如下。

我们创建了两种类型:

t_pivot_test_obj - 包含我们要从 XML 检索的列的类型 t_pivot_test_obj_tab - 上述对象的嵌套表类型。

然后我们创建一个 PIPELINED 函数,其中包含带有PIVOT 的查询,该查询生成 XML(因此您不必对要旋转的值进行硬编码)。此函数从生成的 XML 中提取数据,并在生成时将 (PIPE) 行传递给调用查询(动态 - 它们不会一次全部生成,这对性能很重要)。

最后,您编写一个从该函数中选择记录的查询(最后是此类查询的示例)。

CREATE TABLE pivot_test (
  id            NUMBER,
  customer_id   NUMBER,
  product_code  VARCHAR2(5),
  quantity      NUMBER
);

INSERT INTO pivot_test VALUES (1, 1, 'A', 10);
INSERT INTO pivot_test VALUES (2, 1, 'B', 20);
INSERT INTO pivot_test VALUES (3, 1, 'C', 30);
INSERT INTO pivot_test VALUES (4, 2, 'A', 40);
INSERT INTO pivot_test VALUES (5, 2, 'C', 50);
INSERT INTO pivot_test VALUES (6, 3, 'A', 60);
INSERT INTO pivot_test VALUES (7, 3, 'B', 70);
INSERT INTO pivot_test VALUES (8, 3, 'C', 80);
INSERT INTO pivot_test VALUES (9, 3, 'D', 90);
INSERT INTO pivot_test VALUES (10, 4, 'A', 100);
COMMIT;

CREATE TYPE t_pivot_test_obj AS OBJECT (
  customer_id   NUMBER,
  product_code  VARCHAR2(5),
  sum_quantity  NUMBER
);
/

CREATE TYPE t_pivot_test_obj_tab IS TABLE OF t_pivot_test_obj;
/

CREATE OR REPLACE FUNCTION extract_from_xml RETURN t_pivot_test_obj_tab PIPELINED
AS
  v_xml XMLTYPE;
  v_item_xml XMLTYPE;
  v_index NUMBER;
  v_sum_quantity NUMBER;

  CURSOR c_customer_items IS
    SELECT customer_id, product_code_xml
      FROM (SELECT customer_id, product_code, quantity
              FROM pivot_test)
      PIVOT XML (SUM(quantity) AS sum_quantity FOR (product_code) IN (SELECT DISTINCT product_code 
                                                                      FROM pivot_test));
BEGIN
  -- loop through all records returned by query with PIVOT
  FOR v_rec IN c_customer_items
  LOOP
    v_xml := v_rec.product_code_xml;
    v_index := 1;

    -- loop through all ITEM elements for each customer
    LOOP
      v_item_xml := v_xml.EXTRACT('/PivotSet/item[' || v_index || ']');

      EXIT WHEN v_item_xml IS NULL;

      v_index := v_index + 1;

      IF v_item_xml.EXTRACT('/item/column[@name="SUM_QUANTITY"]/text()') IS NOT NULL THEN
        v_sum_quantity := v_item_xml.EXTRACT('/item/column[@name="SUM_QUANTITY"]/text()').getNumberVal();
      ELSE
        v_sum_quantity := 0;
      END IF;

      -- finally, for each customer and item - PIPE the row to the calling query
      PIPE ROW(t_pivot_test_obj(v_rec.customer_id,
                                v_item_xml.EXTRACT('/item/column[@name="PRODUCT_CODE"]/text()').getStringVal(),
                                v_sum_quantity));
    END LOOP;
  END LOOP;
END;
/

SELECT customer_id, product_code, sum_quantity
  FROM TABLE(extract_from_xml())
;

输出:

CUSTOMER_ID            PRODUCT_CODE SUM_QUANTITY           
---------------------- ------------ ---------------------- 
1                      A            10                     
1                      B            20                     
1                      C            30                     
1                      D            0                      
2                      A            40                     
2                      B            0                      
2                      C            50                     
2                      D            0                      
3                      A            60                     
3                      B            70                     
3                      C            80                     
3                      D            90                     
4                      A            100                    
4                      B            0                      
4                      C            0                      
4                      D            0                      

16 rows selected

【讨论】:

【参考方案2】:

您可以通过迭代生成第一个 SQL 语句的文本,然后单独执行该语句。

如果您不介意准动态解决方案,您可以使用动态 SQL(即立即执行)以这种方式安排视图的创建。

(据我所知,Crystal Report 需要提前知道列名。)

编辑添加代码。我没有测试这个。另请注意,当 SQL 语句超过 32KB 时,这将中断,而不管多字节字符的实际数量。

DECLARE
   sql_statement_ VARCHAR2(32767);
BEGIN
   sql_statement_ := 'CREATE OR REPLACE VIEW population_view AS ' ||
                     'SELECT * FROM population ' ||
                     'PIVOT (AVG(total) FOR data_type IN (';
   FOR rec_ IN (SELECT DISTINCT data_type FROM population) LOOP
      sql_statement_ := sql_statement_ ||
                        '''' || REPLACE(rec_.data_type, '''', '''''') || ''', ';
   END LOOP;
   /* trim last comma and space */
   sql_statement_ = SUBSTR(1, sql_statement_, LENGTH(sql_statement_) - 2);
   /* close statement */
   sql_statement_ = sql_statement_ || ')) WITH READ ONLY';
   /* Rub your rabbit's foot, scatter garlic, and grab your four leaf clover.
      This could hurt if we didn't properly handle injection above. */
   EXECUTE IMMEDIATE sql_statement_;
END;
/

【讨论】:

以上是关于带有子查询的 Oracle 数据透视的主要内容,如果未能解决你的问题,请参考以下文章

如何在 oracle 数据库中为具有复杂聚合的数据透视编写等效的 sql 查询?

Oracle SQL 数据透视查询

具有多索引的 Pandas 子数据透视表和总数据透视表

Oracle SQL 数据透视查询

使用 Sql Developer Oracle 的动态数据透视查询

在子查询中为数据透视列的值实现 WHERE 子句?