我想使用字符串中的正则表达式函数在第二个点（。）之前提取文本，例如：

Posted 2023-05-09

技术标签:

【中文标题】我想使用字符串中的正则表达式函数在第二个点（。）之前提取文本，例如：【英文标题】：I want to extract text before second dot(.) using regexp function from string like : 【发布时间】：2021-02-08 07:45:36 【问题描述】：

我想从字符串中提取第二个点（。）之前的文本：

Input - XYZ.ABC.MNO.CZ 
Output- XYZ.ABC
Input - AWQ.QA
Output- AWQ.QA

【问题讨论】：

【参考方案1】：

看起来你想要除了点之外的任何东西，然后是点，然后是除了点之外的任何东西：

with t (v) as (
  select 'XYZ.ABC.MNO.CZ' from dual union all
  select 'AWQ.QA' from dual
)
select regexp_substr(v,'[^\.]+\.[^\.]+') from t;

【讨论】：

@BarbarosÖzhan 在这种情况下是的，正如我（令人惊讶地）观察到的那样。我决定保留反斜杠，以免给其他正则表达式引擎或其他分隔符带来不好的例子。【参考方案2】：

使用SUBSTR + INSTR 组合（在大型数据集上可能比正则表达式表现更好）：

SQL> with test (col) as
  2    (select 'XYZ.ABC.MNO.CZ' from dual union all
  3     select 'AWQ.QA' from dual
  4    )
  5  select col,
  6         substr(col, 1, case when instr(col, '.', 1, 2) = 0 then length(col)
  7                             else instr(col, '.', 1, 2) - 1
  8                        end
  9               ) result
 10  from test;

COL            RESULT
-------------- --------------
XYZ.ABC.MNO.CZ XYZ.ABC
AWQ.QA         AWQ.QA

SQL>

【讨论】：

【参考方案3】：

此正则表达式处理点分隔字符串的元素为 NULL 的情况。基本上匹配任何东西，一个文字点，然后是后面跟着一个文字点或字符串结尾的任何东西。返回第一组。请注意，如果未找到匹配项，REGEXP_SUBSTR 将返回 NULL（REGEXP_REPLACE 返回原始字符串）。

See this post for more info on why using the REGEX form '[^.]+' does not always work as expected for parsing strings.

WITH T (ID, v) AS (
  SELECT 1, 'XYZ.ABC.MNO.CZ' FROM dual UNION ALL
  SELECT 2, '.ABC.MNO.CZ' FROM dual UNION ALL
  SELECT 3, 'XYZ..MNO.CZ' FROM dual UNION ALL    
  SELECT 4, 'AWQ.QA' FROM dual
)
SELECT ID, REGEXP_SUBSTR(v,'(.*?\..*?)(\.|$)', 1, 1, NULL, 1) substring
FROM T
ORDER BY ID;


        ID SUBSTRING     
---------- --------------
         1 XYZ.ABC       
         2 .ABC          
         3 XYZ.          
         4 AWQ.QA        

4 rows selected.

始终使用数据中的意外情况进行测试。

【讨论】：

以上是关于我想使用字符串中的正则表达式函数在第二个点（。）之前提取文本，例如：的主要内容，如果未能解决你的问题，请参考以下文章