SQL语句中的正则表达式

Posted 张欣橙

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL语句中的正则表达式相关的知识,希望对你有一定的参考价值。

正则表达式

REGEXP_LIKE执行正则表达式匹配

SELECT FIRST_NAME

FROM EMPLOYEES

WHERE REGEXP_LIKE(FIRST_NAME,‘^al(an|yss)a$‘,‘i‘);--al之后是an或yss

SELECT FIRST_NAME

FROM EMPLOYEES

WHERE REGEXP_LIKE(FIRST_NAME,‘^al(.){2}a$‘,‘i‘);--中间有任意一个字母出现两次

SELECT FIRST_NAME

FROM EMPLOYEES

WHERE REGEXP_LIKE(FIRST_NAME,‘^al[^y]+a$‘,‘i‘);--第三个字母不允许是y一直匹配

REGEXP_REPLACE执行正则表达式替换

SELECT PHONE_NUMBER,REGEXP_REPLACE(PHONE_NUMBER,‘\.‘,‘-‘)AS PHONE FROM EMPLOYEES;--必须要加转义字符\ 不加的话  ‘.’代表任意字符

REGEXP_INSTR搜索出现的位置

SELECT STREET_ADDRESS,

REGEXP_INSTR(STREET_ADDRESS,‘[[:alpha:]]‘)AS FIRST_ALPHA_POSITION,--任何字母第一次出现的位置

REGEXP_INSTR(STREET_ADDRESS,‘[[:digit:]]‘)AS FIRST_ALPHA_POSITION,--任何数字第一次出现的位置

REGEXP_INSTR(STREET_ADDRESS,‘[[:alnum:]]‘)AS FIRST_ALPHA_POSITION--任何数字或字母第一次出现的位置

FROM LOCATIONS;

使用REGEXP_SUBSTR控制字符输出

SELECT STREET_ADDRESS,

REGEXP_SUBSTR(STREET_ADDRESS, ‘ [^ ]+ ‘)AS ROAD1,

REGEXP_SUBSTR(STREET_ADDRESS, ‘[^ ]+ ‘)AS ROAD2,

REGEXP_SUBSTR(STREET_ADDRESS, ‘[^ ]+‘)AS ROAD3,

REGEXP_SUBSTR(STREET_ADDRESS, ‘ [^ ]+(.)+‘)AS ROAD4,

REGEXP_SUBSTR(STREET_ADDRESS, ‘[[:alpha:]]‘)AS ROAD5,

REGEXP_SUBSTR(STREET_ADDRESS, ‘[[:alpha:]]+‘)AS ROAD6,

REGEXP_SUBSTR(STREET_ADDRESS, ‘[[:alpha:]]+(.)‘)AS ROAD7,

REGEXP_SUBSTR(STREET_ADDRESS, ‘[[:alpha:]]+(.)+‘)AS ROAD8

FROM LOCATIONS;

. 匹配支持字符集中的任何字符,除了空

+   匹配前面的子表达式一次或多次

|   指明两项之内的一个选择

‘i’不区分大小写的匹配

[[:alpha:]]任何字母

[[:digit:]]任何数字

[[:alnum:]]任何字母和数字

[[:space:]]任何空格

子表达式

SELECT

    REGEXP_INSTR

    (‘0123456789‘,   --源字符

    ‘(123)(4(56)(78))‘,--用于匹配的表达式

    1,               --开始搜索的位置

    1,               --第几次匹配上

    0,               --0返回第一个出现位置;1下一个起始位置

    ‘i‘,             --大小写不敏感

    1)RESULT               --第几个表达式

FROM DUAL;

子表达式中有括号即为一个表达式

如(123(4(56)(78)))中(123(4(56)(78)))为第一个子表达式

(4(56)(78))为第二个表达式 (56)为第三个 (78)为第四个

Check约束和正则表达式:示例

ALTER TABLE EMP8

    ADD CONSTRAINT EMAIL_ADDR

    CHECK(REGEXP_LIKE(email,‘@‘)) NOVALIDATE;

INSERT INTO EMP8 VALUES

    (500,‘Christian‘,‘Patal‘,‘ChrisP2creme.com‘,

    1234567890,‘12-Jan-2004‘,‘HR-REP‘,2000,null,102,40);

select * from t50 where REGEXP_LIKE(email,‘[^@][@][[:alnum:]]+([\.][[:alnum:]]+|[\.][[:alnum:]]+[\.][[:alnum:]]+)[^\.]$‘);

ALTER TABLE t50 ADD CONSTRAINT email_addr CHECK(REGEXP_LIKE(email,‘[^@][@][[:alnum:]]+([\.][[:alnum:]]+|[\.][[:alnum:]]+[\.][[:alnum:]]+)[^\.]$‘)) NOVALIDATE;


表 1:定位元字符

元字符
说明

^
使表达式定位至一行的开头

$
使表达式定位至一行的末尾

表 2:量词或重复操作符

量词
说明

*
匹配 0 次或更多次

?
匹配 0 次或 1 次

+
匹配 1 次或更多次

{m}
正好匹配 m 次

{m,}
至少匹配 m 次

{m, n}
至少匹配 m 次但不超过 n 次

表 3:预定义的 POSIX 字符类

字符类
说明

[:alpha:]
字母字符

[:lower:]
小写字母字符

[:upper:]
大写字母字符

[:digit:]
数字

[:alnum:]
字母数字字符

[:space:]
空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符

[:punct:]
标点字符

[:cntrl:]
控制字符(禁止打印)

[:print:]
可打印字符

表 4:表达式的替换匹配和分组

元字符
说明

|
替换
分隔替换选项,通常与分组操作符 () 一起使用

( )
分组
将子表达式分组为一个替换单元、量词单元或后向引用单元(参见“后向引用”部分)

[char]
字符列表
表示一个字符列表;一个字符列表中的大多数元字符(除字符类、^ 和 - 元字符之外)被理解为文字

表 5:REGEXP_LIKE 操作符

语法
说明

REGEXP_LIKE(source_string, pattern
[, match_parameter])
source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。

表 6:REGEXP_INSTR 函数

语法
说明

REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]])
该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。

表 7: 5 位数字加 4 位邮政编码表达式的说明

语法
说明

必须匹配的空白

[:digit:]
POSIX 数字类

]
字符列表的结尾

{5}
字符列表正好重复出现 5 次

(
子表达式的开头

-
一个文字连字符,因为它不是一个字符列表内的范围元字符

[
字符列表的开头

[:digit:]
POSIX [:digit:]类

[
字符列表的开头

]
字符列表的结尾

{4}
字符列表正好重复出现 4 次

)
结束圆括号,结束子表达式

?
? 量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选

$
定位元字符,指示行尾

表 8:REGEXP_SUBSTR 函数

语法
说明

REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]])
REGEXP_SUBSTR 函数返回匹配模式的子字符串。

表 9: REGEXP_REPLACE 函数

语法
说明

REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]])
该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的“搜索并替换”操作。

表 10:后向引用元字符

元字符
说明

\digit
反斜线
紧跟着一个 1 到 9 之间的数字,反斜线匹配之前的用括号括起来的第 digit 个子表达式。
(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示 Escape 字符。

表 11:模式交换正则表达式的说明

正则表达式项目
说明

(
第一个子表达式的开头

.
匹配除换行符之外的任意单字符

*
重复操作符,匹配之前的 . 元字符 0 到 n 次

)
第一个子表达式的结尾;匹配结果在 \1
中获取(在这个例子中,结果为 Ellen。)

必须存在的空白

(
第二个子表达式的开头

.
匹配除换行符之外的任意单个字符

*
重复操作符,匹配之前的 . 元字符 0 到 n 次

)
第二个子表达式的结尾;匹配结果在 \2
中获取(在这个例子中,结果为 Hildi。)

空白

(
第三个子表达式的开头

.
匹配除换行符之外的任意单字符

*
重复操作符,匹配之前的 . 元字符 0 到 n 次

)
第三个子表达式的结尾;匹配结果在 \3
中获取(在这个例子中,结果为 Smith。)

表 12:社会保险号码正则表达式的说明

正则表达式项目
说明

^
行首字符(正则表达式在匹配之前不能有任何前导字符。)

(
开始子表达式并列出用 | 元字符分开的可替换选项

[
字符列表的开头

[:digit:]
POSIX 数字类

]
字符列表的结尾

{3}
字符列表正好重复出现 3 次

-
连字符

[
字符列表的开头

[:digit:]
POSIX 数字类

]
字符列表的结尾

{2}
字符列表正好重复出现 2 次

-
另一个连字符

[
字符列表的开头

[:digit:]
POSIX 数字类

]
字符列表的结尾

{4}
字符列表正好重复出现 4 次

|
替换元字符;结束第一个选项并开始下一个替换表达式

[
字符列表的开头

[:digit:]
POSIX 数字类

]
字符列表的结尾

{9}
字符列表正好重复出现 9 次

)
结束圆括号,结束用于替换的子表达式组

$
定位元字符,指示行尾;没有额外的字符能够符合模式








































































































以上是关于SQL语句中的正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

如何在sql语句中使用正则表达式

java:正则表达式检查SQL WHERE条件语句防止注入攻击和常量表达式

数据库笔记-SQL过滤(LIKE&正则表达式)

使用正则表达式获取Sql查询语句各项(表名字段条件排序)

SQL查找和替换正则表达式捕获组限制?

Oracle正则表达式