正则表达式

Posted 明日学院

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式相关的知识,希望对你有一定的参考价值。

正则表达式通常被用于判断语句中,用来检查某一字符串是否满足某一格式。我们可以调用String中的matches(String regex)方法.,判断字符串是否匹配给定的正则表达式,返回布尔值。

语法如下:

str. matches(regex);

þ  str–任意字符串。

þ  regex–用来匹配的正则表达式。

正则表达式是含有一些具有特殊意义字符的字符串,这些特殊字符称为正则表达式的元字符。例如,“\\\\d”表示数字0~9中的任何一个,“\\\\d”就是元字符。正则表达式中元字符及其意义如表7.4所示。

表7.4  元字符

说明:在正则表达式中“.”代表任何一个字符,因此在正则表达式中如果想使用普通意义的点字符“.”,必须使用转义字符“\\\\.”。

在正则表达式中可以使用方括号括起来若干个字符来表示一个元字符,该元字符可代表方括号中的任何一个字符。例如,reg = “[abc]4”,这样字符串“a4”、“b4”、“c4”都是和正则表达式匹配的字符串。除此之外还有很多格式。如:

þ  [^456]:代表4、5、6之外的任何字符。

þ  [a-r]:代表a~r中的任何一个字母。

þ  [a-zA-Z]:可表示任意一个英文字母。

þ  [a-e[g-z]]:代表a~e,或g~z中的任何一个字母(并运算)。

þ  [a-o&&[def]]:代表字母d、e、f(交运算)。

þ  [a-d&&[^bc]]:代表字母a、d(差运算)。

þ  (ab)|(13)|(50):代表”ab”、”13”、”50”中任意一值。

在正则表达式中允许使用限定修饰符来限定元字符出现的次数。例如,“A*”代表A可在字符串中出现0次或多次。修饰限定符的用法如表7.5所示。

表7.5  限定符

【例7.39】使用正则表达式来判断指定的变量是否是合法的E-mail地址。

01     publicclass Example7_39 {
02         publicstaticvoid main(String[] args) {
03             // 定义要匹配E_mail地址的正则表达式
04             String regex = "\\\\w+@\\\\w+(\\\\.\\\\w{2,3})*\\\\.\\\\w{2,3}";
05             // 定义要进行验证的字符串
06             String str1 = "aaa@";
07             String str2 = "aaaaa";
08             String str3 = "1111@111ffyu.dfg.com";
09             String str4 = "wangxiaoer@163.com";
10             // 判断字符串变量是否与正则表达式匹配
11             if (str1.matches(regex)) { 
12                 System.out.println(str1 + "是一个合法的E-mail地址格式");
13             }
14             if (str2.matches(regex)) {
15                 System.out.println(str2 + "是一个合法的E-mail地址格式");
16             }
17             if (str3.matches(regex)) {
18                 System.out.println(str3 + "是一个合法的E-mail地址格式");
19             }
20             if (str4.matches(regex)) {
21                 System.out.println(str4 + "是一个合法的E-mail地址格式");
22             }
23         }
24     }

运行结果如图7.45。

 

图7.45  例7.39运行结果

正则表达式分析:

通常情况下E_mail的格式为“X@X.com.cn”。字符X表示任意的一个或多个字符,@为E_mail地址中的特有符号,符号@后还有一个或多个字符,之后是字符“.com”,也可能后面还有类似“.cn”的标记。总结E-mail地址的这些特点,因此可以书写正则表达式“\\\\w+@\\\\w+(\\\\.\\\\w{2,3})*\\\\.\\\\w{2,3}”来匹配E_mail地址。字符集“\\\\w”匹配任意字符,符号“+”表示字符可以出现1次或多次,表达式“(\\\\.\\\\w{2.3})*”表示形如“.vip”格式的字符串可以出现0次或多次。而最后的表达式“\\\\.\\\\w{2.3}”用于匹配E_mail地址中的结尾字符,如“.com”、“.cn”。

本文摘自明日科技出版的《Java从入门到精通》,转载请注明出处!!!

 

以上是关于正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

markdown 正则表达式模式片段

正则表达式匹配特定的 URL 片段而不是所有其他 URL 可能性

循环通过 python 正则表达式匹配

asp.net 使用正则表达式验证包含打开/关闭括号片段的属性字符串

攻破难啃的骨头-正则表达式(转)

正则表达式的贪婪和非贪婪模式