正则表达式
Posted hgfs瑞
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了正则表达式相关的知识,希望对你有一定的参考价值。
正则应用场景:1、匹配 2、查找 3、 替换 4、切割
预定义字符类:
. | 任何字符(与行结束符可能匹配也可能不匹配) |
\d | 数字:[0-9] |
\D | 非数字:[^0-9] |
\s | 空白字符:[\t\n\r\f\x0B] |
\S | 非空白:[^\s] |
\w | 单词字符:[a-zA-Z_0-9] |
\W | 飞单词字符:[^\w] |
数量词:
X? |
X,一次或一次也没有 |
X* |
X,零次或多次 |
X+ |
X,一次或多次 |
X{n} |
X,恰好n次 |
X{n,} |
X,至少n次 |
X{n,m} |
X,至少n次,但是不超过m次 |
System.out.println( "a".matches(".") ); System.out.println( "a".matches("a") ); System.out.println("a".matches("a?") ); System.out.println( "aaa".matches("a*") ); System.out.println( "".matches("a+") ); System.out.println( "aaaaa".matches("a{5}") ); System.out.println( "aaaaaaaaa".matches("a{5,8}") ); System.out.println( "aaa".matches("a{5,}") ); System.out.println( "aaaaab".matches("a{5,}") ); |
范围表示:
[abc] | a、b 或 c(简单类) |
[^abc] | 任何字符除了a、b或者c |
替换例子1:匹配QQ号( [1-9]表示是第一位数字是会出现1-9范围之间的其中一个,下来的数字范围会出现在0-9之间,至少出现4次,最多出现14次。)
public static void checkQQ2() { String qq = "12345"; String reg = "[1-9][0-9]{4,14}"; boolean b = qq.matches(reg); System.out.println("b="+b); }
替换例子2:匹配手机号码(第一位是1,第二位[34578])
public static void checkTel() { String tel = "25800001111"; String reg = "1[35]\\d{9}";//在字符串中,定义正则出现\ 要一对出现。 boolean b= tel.matches(reg); System.out.println(tel+":"+b); }
切割例子1:
package cd.itcast.runble; public class Demo6 { public static void main(String[] args) { String str="aa b c fdewfe"; String reg=" +"; String[] arr = str.split(reg); //for的新特性,遍历数组或者集合 for(String s : arr){ System.out.println(s); } } }
切割例子2:根据重复词进行切割。
package cd.itcast.runble; /** * 根据重复词进行切割 * @author Administrator *2016/11/11 */ public class Demo7 { public static void main(String[] args) { String str1="甘甘兴瑞,努努力学学学习,加加油工作!"; //正则的分组:就是让正则的内容被复用起来,组好从1开始编号,不能改变。引用1,\\1,外部引用$1. String reg="(.)\\1+"; String[] arr = str1.split(reg); for(String s : arr){ System.out.println(s); } } }
替换例子1:
String str = "联系我:13567012119联系我:13567012119联系我:13567012119联系我:13567012119联系我:13567012119联系我:13567012119"; String reg= "1[34578]\\d{9}"; str = str.replaceAll(reg,"******"); System.out.println("替换后的帖子:"+ str);
替换例子2:分组的外部引用,祛除重复的字。
package cd.itcast.runble; /** * 根据重复词进行切割 * @author Administrator *2016/11/11 */ public class Demo7 { public static void main(String[] args) { String str1="甘甘兴瑞,努努力学学学习,加加油工作!"; //正则的分组:就是让正则的内容被复用起来,组好从1开始编号,不能改变。引用1,\\1,外部引用$1. //((A)(B(C))) 组1((A)(B(C))) 组2(A) 组3(B(C)) 组4(C) 编号例子 String reg="(.)\\1+"; //外部引用$1. String str2 = str1.replaceAll(reg, "$1"); System.out.println(str2); //甘兴瑞,努力学习,加油工作! } }
获取的范例:
Pattern p = Pattern.compile("a*b");
Matcher m = p.matcher("aaaaab");
boolean b = m.matches();
步骤:
1、先将正则表达式编译成正则对象。使用的是Pattern类一个静态的方法。compile(regex);
2、让正则对象和要操作的字符串相关联,通过matcher方法完成,并返回匹配器对象。
3、通过匹配器对象的方法将正则模式作用到字符串上对字符串进行针对性的功能操作。
例子:获取由3个字母组成的单词。
public static void getDemo() { String str = "da jia zhu yi le,ming tian bu fang jia,xie xie!"; //想要获取由3个字母组成的单词。 //刚才的功能返回的都是一个结果,只有split返回的是数组,但是它是把规则作为分隔符,不会获取符合规则的内容。 //这时我们要用到一些正则对象。 String reg = "\\b[a-z]{3}\\b"; Pattern p = Pattern.compile(reg); Matcher m = p.matcher(str); while(m.find()) { System.out.println(m.start()+"...."+m.end()); System.out.println("sub:"+str.substring(m.start(),m.end())); System.out.println(m.group()); } // System.out.println(m.find());//将规则对字符串进行匹配查找。 // System.out.println(m.find());//将规则对字符串进行匹配查找。 // System.out.println(m.group());//在使用group方法之前,必须要先找,找到了才可以取。 }
以上是关于正则表达式的主要内容,如果未能解决你的问题,请参考以下文章
正则表达式匹配特定的 URL 片段而不是所有其他 URL 可能性