00066_正则表达式

Posted Lamfai

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了00066_正则表达式相关的知识,希望对你有一定的参考价值。

1、正则表达式的概念

  (1)正则表达式(英语:Regular Expression,在代码中常简写为regex);

  (2)正则表达式是一个字符串,使用单个字符串来描述、用来定义匹配规则,匹配一系列符合某个句法规则的字符串;

  (3)在开发中,正则表达式通常被用来检索、替换那些符合某个规则的文本。

2、正则表达式的匹配规则

  (1)参照帮助文档,在Pattern类中有正则表达式的的规则定义,正则表达式中明确区分大小写字母;

  (2)字符:x
  含义:代表的是字符x;
  例如:匹配规则为 "a",那么需要匹配的字符串内容就是 ”a”。

  (3)字符:\\
  含义:代表的是反斜线字符‘\‘;
  例如:匹配规则为"\\" ,那么需要匹配的字符串内容就是 ”\”。

  (4)字符:\t
  含义:制表符;
  例如:匹配规则为"\t" ,那么对应的效果就是产生一个制表符的空间。

  (5)字符:\n
  含义:换行符;
  例如:匹配规则为"\n",那么对应的效果就是换行,光标在原有位置的下一行。

  (6)字符:\r
  含义:回车符;
  例如:匹配规则为"\r" ,那么对应的效果就是回车后的效果,光标来到下一行行首。

  (7)字符类:[abc]
  含义:代表的是字符a、b 或 c;
  例如:匹配规则为"[abc]" ,那么需要匹配的内容就是字符a,或者字符b,或字符c的一个。

  (8)字符类:[^abc]
  含义:代表的是除了 a、b 或 c以外的任何字符;
  例如:匹配规则为"[^abc]",那么需要匹配的内容就是不是字符a,或者不是字符b,或不是字符c的任意一个字符。

  (9)字符类:[a-zA-Z]
  含义:代表的是a 到 z 或 A 到 Z,两头的字母包括在内;
  例如:匹配规则为"[a-zA-Z]",那么需要匹配的是一个大写或者小写字母。

  (10)字符类:[0-9]
  含义:代表的是 0到9数字,两头的数字包括在内;
  例如:匹配规则为"[0-9]",那么需要匹配的是一个数字。

  (11)字符类:[a-zA-Z_0-9]
  含义:代表的字母或者数字或者下划线(即单词字符);
  例如:匹配规则为" [a-zA-Z_0-9] ",那么需要匹配的是一个字母或者是一个数字或一个下划线。

  (12)预定义字符类:.
  含义:代表的是任何字符;
  例如:匹配规则为" . ",那么需要匹配的是一个任意字符。如果,就想使用 . 的话,使用匹配规则"\\."来实现。

  (13)预定义字符类:\d
  含义:代表的是 0到9数字,两头的数字包括在内,相当于[0-9];
  例如:匹配规则为"\d ",那么需要匹配的是一个数字。

  (14) 预定义字符类:\w
  含义:代表的字母或者数字或者下划线(即单词字符),相当于[a-zA-Z_0-9];
  例如:匹配规则为"\w ",,那么需要匹配的是一个字母或者是一个数字或一个下划线。

  (15)边界匹配器:^
  含义:代表的是行的开头;
  例如:匹配规则为^[abc][0-9]$ ,那么需要匹配的内容从[abc]这个位置开始, 相当于左双引号。

  (16)边界匹配器:$
  含义:代表的是行的结尾;
  例如:匹配规则为^[abc][0-9]$ ,那么需要匹配的内容以[0-9]这个结束, 相当于右双引号。

  (17)边界匹配器:\b
  含义:代表的是单词边界;
  例如:匹配规则为"\b[abc]\b" ,那么代表的是字母a或b或c的左右两边需要的是非单词字符([a-zA-Z_0-9])。

  (18)数量词:X?
  含义:代表的是X出现一次或一次也没有;
  例如:匹配规则为"a?",那么需要匹配的内容是一个字符a,或者一个a都没有。

  (19)数量词:X*
  含义:代表的是X出现零次或多次;
  例如:匹配规则为"a*" ,那么需要匹配的内容是多个字符a,或者一个a都没有。

  (20)数量词:X+
  含义:代表的是X出现一次或多次;
  例如:匹配规则为"a+",那么需要匹配的内容是多个字符a,或者一个a。

  (21)数量词:X{n}
  含义:代表的是X出现恰好 n 次;
  例如:匹配规则为"a{5}",那么需要匹配的内容是5个字符a。

  (22)数量词:X{n,}
  含义:代表的是X出现至少 n 次;

  例如:匹配规则为"a{5, }",那么需要匹配的内容是最少有5个字符a。

  (23)数量词:X{n,m}
  含义:代表的是X出现至少 n 次,但是不超过 m 次;
  例如:匹配规则为"a{5,8}",那么需要匹配的内容是有5个字符a 到 8个字符a之间。

以上是关于00066_正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

JAVA正则表达式判断 只能包含汉字、英文、“_”和数字 ,正则该怎么写呢?

js_高级_正则表达式

正则表达式过滤'_'下划线。

第五课-第一讲05_01_egrep及扩展正则表达式

正则表达式如何提取中间的数字?

python_正则表达式_re