正则表达式

Posted Eric%258436

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式相关的知识,希望对你有一定的参考价值。

** 如有错误,感谢指正**

请根据目录寻找自己需要的段落

导语:本博客为个人整理Java学习记录帖,如有错误,感谢指正。系统学习,欢迎持续关注,后续陆陆续续更新Java后端项目,Java部分我不打算更新基础部分知识,会从JavaWeb开始更新文章。

What is RE(Regular Expression)?

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。本篇针对Java版和python版

正则表达式的作用

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个"规则字符串”,这个“规则字符串"用来表达对字符串的一种过滤逻辑。使用特殊语法来表示字符类、数量限定符和位置关系,然后用这些特殊语法和普通字符一起表示一个模式。

正则表达式的特点

灵活性、逻辑性和功能性非常的强;
可以迅速地用极简单的方式达到字符串的复杂控制
对于刚接触的人来说,比较晦涩难懂

java中正则表达式的使用

在Java中正则表达式为string类型,被验证的内容同样为String类型。通过string 类中的matches方法实现内容的匹配校验。如:“被验证内容”.matches(“正则表达式”)

正则表达式语法规则

正则表达式语法规则:[内容限定]{长度限定}
内容限定

在定义限定内容规则时,如果没有指定长度限定,那么默认长度为1。

单个字符限定:
[a]:表示当前内容必须是字母a
范围字符限定:
[a-z0-9]:表示内容可以是a-z之间的任意字母或者0-9之间的任意数字,不分先后。
取反限定:
[^abc]:表示内容不能是a或b或c。

长度限定

在正则表达式中通过{}来限定内容长度。
固定长度:{固定长度值}
范围长度:{最小长度值,最大长度值}
[a-z]{5}:表示内容范围为小写字母a到z且长度必须为5
[a-z][2,8}:表示内容范围为小写字母a到z且长度在2到8之间,包含2与8
[a-z][2}:表示内容范围为小写字母a到z且最小长度为2,最大长度无限制
[a-z]{0,2}:表示内容范围为小写字母a到z且最小长度为o,最大长度为2
长度限定符号
长度限定符号是指通过预定义符号来完成长度限定。
?:零次或一次。等同于{0,1}
+:一次或多次。等同于{1,}
*:零次或多次。等同于{0,}

预定义字符

在正则表达式中可以通过一些预定义字符来表示内容限定。目的是为了简化内容限定的定义

\\d 匹配一个数字字符,等价于[o-9]。
\\D 匹配一个非数字字符,等价于[^O-9]。
\\n 匹配一个换行符。
\\r 匹配一个回车符。
\\s 匹配任何空白字符,包括空格、制表符、换页符等等。
\\S 匹配任何非空白字符。
\\t 匹配一个制表符。
\\w 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]”"。
\\W 匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。

正则表达式的组合定义

在正则表达式中可以通过多个内容限定与长度限定来组合定义。
例如 必须是以字母开头,最少长度为4,最大长度为8。" [a-z]{1}\\\\w{ 3,8 }"

常见正则表达式

// 邮箱 ([a-z0-9A-Z]+[-|\\\\.]?)+[a-z0-9A-Z]@([a-z0-9A-Z]+(-[a-z0-9A-Z]+)?\\\\.)+[a-zA-Z]{2,}
	// | 表示或者 \\\\.表示任意字符
// IP 地址 (25[0-5]|2[0-4]\\\\d|[0-1]\\\\d{2}|[1-9]?\\\\d)
// URL http(s)?://([\\\\w-]+\\\\.)+[\\\\w-]+(/[\\\\w- ./?%&=]*)?
// 身份证号码 (^\\\\d{18}$)|(^\\\\d{15}$

以上是关于正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

markdown 正则表达式模式片段

正则表达式匹配特定的 URL 片段而不是所有其他 URL 可能性

循环通过 python 正则表达式匹配

asp.net 使用正则表达式验证包含打开/关闭括号片段的属性字符串

攻破难啃的骨头-正则表达式(转)

正则表达式的贪婪和非贪婪模式