SQL语句中的正则表达式
Posted 张欣橙
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL语句中的正则表达式相关的知识,希望对你有一定的参考价值。
正则表达式
REGEXP_LIKE执行正则表达式匹配
SELECT FIRST_NAME
FROM EMPLOYEES
WHERE REGEXP_LIKE(FIRST_NAME,‘^al(an|yss)a$‘,‘i‘);--al之后是an或yss
SELECT FIRST_NAME
FROM EMPLOYEES
WHERE REGEXP_LIKE(FIRST_NAME,‘^al(.){2}a$‘,‘i‘);--中间有任意一个字母出现两次
SELECT FIRST_NAME
FROM EMPLOYEES
WHERE REGEXP_LIKE(FIRST_NAME,‘^al[^y]+a$‘,‘i‘);--第三个字母不允许是y一直匹配
REGEXP_REPLACE执行正则表达式替换
SELECT PHONE_NUMBER,REGEXP_REPLACE(PHONE_NUMBER,‘\.‘,‘-‘)AS PHONE FROM EMPLOYEES;--必须要加转义字符\ 不加的话 ‘.’代表任意字符
REGEXP_INSTR搜索出现的位置
SELECT STREET_ADDRESS,
REGEXP_INSTR(STREET_ADDRESS,‘[[:alpha:]]‘)AS FIRST_ALPHA_POSITION,--任何字母第一次出现的位置
REGEXP_INSTR(STREET_ADDRESS,‘[[:digit:]]‘)AS FIRST_ALPHA_POSITION,--任何数字第一次出现的位置
REGEXP_INSTR(STREET_ADDRESS,‘[[:alnum:]]‘)AS FIRST_ALPHA_POSITION--任何数字或字母第一次出现的位置
FROM LOCATIONS;
使用REGEXP_SUBSTR控制字符输出
SELECT STREET_ADDRESS,
REGEXP_SUBSTR(STREET_ADDRESS, ‘ [^ ]+ ‘)AS ROAD1,
REGEXP_SUBSTR(STREET_ADDRESS, ‘[^ ]+ ‘)AS ROAD2,
REGEXP_SUBSTR(STREET_ADDRESS, ‘[^ ]+‘)AS ROAD3,
REGEXP_SUBSTR(STREET_ADDRESS, ‘ [^ ]+(.)+‘)AS ROAD4,
REGEXP_SUBSTR(STREET_ADDRESS, ‘[[:alpha:]]‘)AS ROAD5,
REGEXP_SUBSTR(STREET_ADDRESS, ‘[[:alpha:]]+‘)AS ROAD6,
REGEXP_SUBSTR(STREET_ADDRESS, ‘[[:alpha:]]+(.)‘)AS ROAD7,
REGEXP_SUBSTR(STREET_ADDRESS, ‘[[:alpha:]]+(.)+‘)AS ROAD8
FROM LOCATIONS;
. 匹配支持字符集中的任何字符,除了空
+ 匹配前面的子表达式一次或多次
| 指明两项之内的一个选择
‘i’不区分大小写的匹配
[[:alpha:]]任何字母
[[:digit:]]任何数字
[[:alnum:]]任何字母和数字
[[:space:]]任何空格
子表达式
SELECT
REGEXP_INSTR
(‘0123456789‘, --源字符
‘(123)(4(56)(78))‘,--用于匹配的表达式
1, --开始搜索的位置
1, --第几次匹配上
0, --0返回第一个出现位置;1下一个起始位置
‘i‘, --大小写不敏感
1)RESULT --第几个表达式
FROM DUAL;
子表达式中有括号即为一个表达式
如(123(4(56)(78)))中(123(4(56)(78)))为第一个子表达式
(4(56)(78))为第二个表达式 (56)为第三个 (78)为第四个
Check约束和正则表达式:示例
ALTER TABLE EMP8
ADD CONSTRAINT EMAIL_ADDR
CHECK(REGEXP_LIKE(email,‘@‘)) NOVALIDATE;
INSERT INTO EMP8 VALUES
(500,‘Christian‘,‘Patal‘,‘ChrisP2creme.com‘,
1234567890,‘12-Jan-2004‘,‘HR-REP‘,2000,null,102,40);
select * from t50 where REGEXP_LIKE(email,‘[^@][@][[:alnum:]]+([\.][[:alnum:]]+|[\.][[:alnum:]]+[\.][[:alnum:]]+)[^\.]$‘);
ALTER TABLE t50 ADD CONSTRAINT email_addr CHECK(REGEXP_LIKE(email,‘[^@][@][[:alnum:]]+([\.][[:alnum:]]+|[\.][[:alnum:]]+[\.][[:alnum:]]+)[^\.]$‘)) NOVALIDATE;
元字符
说明
^
使表达式定位至一行的开头
$
使表达式定位至一行的末尾
量词
说明
*
匹配 0 次或更多次
?
匹配 0 次或 1 次
+
匹配 1 次或更多次
{m}
正好匹配 m 次
{m,}
至少匹配 m 次
{m, n}
至少匹配 m 次但不超过 n 次
字符类
说明
[:alpha:]
字母字符
[:lower:]
小写字母字符
[:upper:]
大写字母字符
[:digit:]
数字
[:alnum:]
字母数字字符
[:space:]
空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符
[:punct:]
标点字符
[:cntrl:]
控制字符(禁止打印)
[:print:]
可打印字符
元字符
说明
|
替换
分隔替换选项,通常与分组操作符 () 一起使用
( )
分组
将子表达式分组为一个替换单元、量词单元或后向引用单元(参见“后向引用”部分)
[char]
字符列表
表示一个字符列表;一个字符列表中的大多数元字符(除字符类、^ 和 - 元字符之外)被理解为文字
语法
说明
REGEXP_LIKE(source_string, pattern
[, match_parameter])
source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。
语法
说明
REGEXP_INSTR(source_string, pattern
[, start_position
[, occurrence
[, return_option
[, match_parameter]]]])
该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。
语法
说明
必须匹配的空白
[:digit:]
POSIX 数字类
]
字符列表的结尾
{5}
字符列表正好重复出现 5 次
(
子表达式的开头
-
一个文字连字符,因为它不是一个字符列表内的范围元字符
[
字符列表的开头
[:digit:]
POSIX [:digit:]类
[
字符列表的开头
]
字符列表的结尾
{4}
字符列表正好重复出现 4 次
)
结束圆括号,结束子表达式
?
? 量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选
$
定位元字符,指示行尾
语法
说明
REGEXP_SUBSTR(source_string, pattern
[, position [, occurrence
[, match_parameter]]])
REGEXP_SUBSTR 函数返回匹配模式的子字符串。
语法
说明
REGEXP_REPLACE(source_string, pattern
[, replace_string [, position
[,occurrence, [match_parameter]]]])
该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的“搜索并替换”操作。
元字符
说明
\digit
反斜线
紧跟着一个 1 到 9 之间的数字,反斜线匹配之前的用括号括起来的第 digit 个子表达式。
(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示 Escape 字符。
正则表达式项目
说明
(
第一个子表达式的开头
.
匹配除换行符之外的任意单字符
*
重复操作符,匹配之前的 . 元字符 0 到 n 次
)
第一个子表达式的结尾;匹配结果在 \1
中获取(在这个例子中,结果为 Ellen。)
必须存在的空白
(
第二个子表达式的开头
.
匹配除换行符之外的任意单个字符
*
重复操作符,匹配之前的 . 元字符 0 到 n 次
)
第二个子表达式的结尾;匹配结果在 \2
中获取(在这个例子中,结果为 Hildi。)
空白
(
第三个子表达式的开头
.
匹配除换行符之外的任意单字符
*
重复操作符,匹配之前的 . 元字符 0 到 n 次
)
第三个子表达式的结尾;匹配结果在 \3
中获取(在这个例子中,结果为 Smith。)
正则表达式项目
说明
^
行首字符(正则表达式在匹配之前不能有任何前导字符。)
(
开始子表达式并列出用 | 元字符分开的可替换选项
[
字符列表的开头
[:digit:]
POSIX 数字类
]
字符列表的结尾
{3}
字符列表正好重复出现 3 次
-
连字符
[
字符列表的开头
[:digit:]
POSIX 数字类
]
字符列表的结尾
{2}
字符列表正好重复出现 2 次
-
另一个连字符
[
字符列表的开头
[:digit:]
POSIX 数字类
]
字符列表的结尾
{4}
字符列表正好重复出现 4 次
|
替换元字符;结束第一个选项并开始下一个替换表达式
[
字符列表的开头
[:digit:]
POSIX 数字类
]
字符列表的结尾
{9}
字符列表正好重复出现 9 次
)
结束圆括号,结束用于替换的子表达式组
$
定位元字符,指示行尾;没有额外的字符能够符合模式
以上是关于SQL语句中的正则表达式的主要内容,如果未能解决你的问题,请参考以下文章