将逗号分隔值拆分为 Oracle 中的列

Posted

技术标签:

【中文标题】将逗号分隔值拆分为 Oracle 中的列【英文标题】:Split comma separated values to columns in Oracle 【发布时间】:2015-10-06 11:50:10 【问题描述】:

我返回的值包含 255 个逗号分隔值。有没有一种简单的方法可以将它们分成没有 255 个子串的列?

ROW  | VAL
----------- 
1    | 1.25, 3.87, 2, ... 
2    | 5, 4, 3.3, ....

ROW | VAL | VAL | VAL ...
--------------------- 
1   |1.25 |3.87 | 2 ...     
2   | 5   | 4   | 3.3 ...

【问题讨论】:

为什么不用excel呢?并从那里编码? ..因为自动化过程驻留在数据库中。 【参考方案1】:

可以使用分层查询。可以使用 case 和 group by 来完成旋转。

with value_t as
( 
  select row_t,row_number() OVER (partition by row_t order by rownum )rn,
  regexp_substr(val, '[^,]+', 1, LEVEL) val from Table1
CONNECT BY LEVEL <= regexp_count(val, '[^,]+') 
AND prior row_t = row_t 
AND prior sys_guid() is not null
  ) select row_t, max( case when rn = 1 THEN val end ) val_1,
  max( case when rn = 2 THEN val end ) val_2,
  max( case when rn = 3 THEN val end ) val_3
  from value_t
  group by row_t;

【讨论】:

【参考方案2】:

如果你只有一行,有时间来创建你的

创建您自己的内置cto_tablefunction to split a string on any separator,然后您可以使用PIVOT + LISTAGG 进行如下操作:
select * from (
  select rownum r , collection.*  
    from TABLE(cto_table(',','1.25, 3.87, 2, 19,, 1, 9, ')) collection
)
PIVOT ( 
  LISTAGG(column_value) within group (order by 1) as val 
  for r in (1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
)

仅供参考:这里是创建cto_table函数的方法:

CREATE OR REPLACE TYPE t_my_list AS TABLE OF VARCHAR2(100);
CREATE OR REPLACE
FUNCTION cto_table(p_sep in Varchar2, p_list IN VARCHAR2)
  RETURN t_my_list
AS
  l_string VARCHAR2(32767) := p_list || p_sep;
  l_sep_index PLS_INTEGER;
  l_index PLS_INTEGER := 1;
  l_tab t_my_list     := t_my_list();
BEGIN
  LOOP
    l_sep_index := INSTR(l_string, p_sep, l_index);
    EXIT
  WHEN l_sep_index = 0;
    l_tab.EXTEND;
    l_tab(l_tab.COUNT) := TRIM(SUBSTR(l_string,l_index,l_sep_index - l_index));
    l_index            := l_sep_index + 1;
  END LOOP;
  RETURN l_tab;
END cto_table;
/

【讨论】:

【参考方案3】:

小心!如果列表中有一个空元素并且您想要该项目或它之后的一个,则格式 '[^,]+' 的 regexp_substr 表达式将不会返回预期值。考虑这个示例,其中第 4 个元素为 NULL,我想要第 5 个元素,因此期望返回“5”:

SQL> select regexp_substr('1,2,3,,5,6', '[^,]+', 1, 5) from dual;

R
-
6

惊喜!它返回第 5 个非空元素,而不是实际的第 5 个元素!返回的数据不正确,您甚至可能无法捕捉到它。试试这个:

SQL> select regexp_substr('1,2,3,,5,6', '(.*?)(,|$)', 1, 5, NULL, 1) from dual;

R
-
5

因此,上述更正后的 REGEXP_SUBSTR 表示要查找第 5 次出现的 0 个或多个逗号分隔字符,后跟逗号或行尾(允许使用下一个分隔符,无论是逗号还是行),找到后返回第一个子组(数据不包括逗号或行尾)。

搜索匹配模式'(.*?)(,|$)' 解释:

(             = Start a group
.             = match any character
*             = 0 or more matches of the preceding character
?             = Match 0 or 1 occurrences of the preceding pattern
)             = End the 1st group
(             = Start a new group (also used for logical OR)
,             = comma
|             = OR
$             = End of the line
)             = End the 2nd group

编辑:添加了更多信息并简化了正则表达式。

有关更多信息和将其封装在函数中以便于重用的建议,请参阅此帖子:REGEX to select nth value from a list, allowing for nulls 这是我发现'[^,]+' 格式有问题的帖子。不幸的是,这是您最常看到的正则表达式格式,可以作为有关如何解析列表的问题的答案。想到'[^,]+'返回的所有错误数据我都不寒而栗!

【讨论】:

感谢您的观察。这对我帮助很大。我注意到正则表达式的解释有一个错误。这部分不正确:* = 0 或更多匹配前一个字符? = 匹配前面模式的 0 或 1 次出现 如果它为真,则正则表达式将不起作用。它应该是这样的:*? = 在零次和无限次之间匹配,尽可能少,根据需要扩展(惰性) 分隔符为 | 时不起作用(管道)插入,(逗号) @JitendraPatel 我怀疑你正在寻找'(.*?)(\||$)' 你需要转义你的文字管道,因为它是正则表达式语言中的一个特殊字符,意思是或。【参考方案4】:

你可以使用regexp_substr():

select regexp_substr(val, '[^,]+', 1, 1) as val1, 
       regexp_substr(val, '[^,]+', 1, 2) as val2, 
       regexp_substr(val, '[^,]+', 1, 3) as val3, 
       . . .

我建议您在 Excel(或其他电子表格)中生成一列 255 个数字,并使用电子表格生成 SQL 代码。

【讨论】:

这不是一个正确的答案,因为问题明确指出“没有 255 个子字符串”。另外,请注意 Gary_W 的回答,这是一个非常有效的问题。 @Wouter 。 . .答案的重点是在电子表格中生成值。 是的;聪明的。但仍然没有回答手头的问题。

以上是关于将逗号分隔值拆分为 Oracle 中的列的主要内容,如果未能解决你的问题,请参考以下文章

如何根据oracle plsql中列中的逗号分隔值拆分选择查询行

如何将逗号分隔值放入oracle中的列

如何根据一个字段是不是包含oracle sql中的逗号分隔字符串将单行拆分为多行?

将逗号分隔的列条目拆分为行

无法在数据准备中的列中转义逗号

使用 SSIS OR T-SQL 将一列带引号和不带引号的逗号分隔值拆分为多列