JavaScript正则常用知识总结

Posted bonnie3449

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JavaScript正则常用知识总结相关的知识,希望对你有一定的参考价值。

一、javascript正则相关方法

str.match(regexp)与regexp.exec(str)功能类似。

str.search(regexp)与regexp.test(str)功能类似。

1. String.prototype.match()

检索匹配项,并返回匹配的第一个完整子串及其下捕获组捕获结果构成的数组(无g),或返回匹配的所有的完整子串(有g)

语法

str.match(regexp)
param:
  • regexp: 一个正则表达式对象。如果传入一个非正则表达式对象,则会隐式地使用 new RegExp(obj) 将其转换为一个 RegExp 。
return:
  • 如果正则表达式不包含g标志:会返回一个数组,数组的第一项是进行匹配完整的字符串,之后的项是用圆括号捕获的结果;数组还会包含一个 index属性,其值为匹配结果中的完整字符串在原字符串中的索引;数组还会包含一个 input属性, 其值为原字符串。此时返回的结果和 regexp.exec()返回的结果是完全相同的。

  • 如果正则表达式包含g标志:会返回一个数组,包含所有匹配的完整子字符串,但不包含匹配的捕获组捕获结果;也没有index属性和Input属性。

  • 如果提供了正则表达式,但是没有匹配到(无论是否带g): 返回null

  • 如果未提供任何参数,直接使用 match(): 返回一个包含空字符串的 Array :[""],同时该Array还包含index属性为0,input属性为原字符串 。

示例1: 正则表达式不带g, 带有捕获组, 且只有一个完整匹配

var str = ‘For more information, see Chapter 3.4.5.1‘;
var reg = /see (chapter d+(.d)*)/i;

var result = str.match(reg);

/* result:
[ 
  "see Chapter 3.4.5.1", 
  "Chapter 3.4.5.1", 
  ".1", 
  index: 22, 
  input: "For more information, see Chapter 3.4.5.1", groups: undefined
]
*/

// ‘see Chapter 3.4.5.1‘ 是整个匹配。
// ‘Chapter 3.4.5.1‘ 被‘(chapter d+(.d)*)‘捕获。
// ‘.1‘ 是被‘(.d)‘捕获的最后一个值。
// ‘index‘ 属性(22) 是整个匹配从零开始的索引。
// ‘input‘ 属性是被解析的原始字符串。

示例2:正则表达式带g, 带有捕获组, 且只有一个完整匹配

var str = ‘For more information, see Chapter 3.4.5.1‘;
var reg = /see (chapter d+(.d)*)/ig;

var result = str.match(reg);

/* result:

[
  "see Chapter 3.4.5.1"
]
*/

示例3:正则表达式带g, 不带捕获组,有多个完整匹配

var str = ‘ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz‘;
var regexp = /[A-E]/gi;
var result = str.match(regexp);

/* result:
["A", "B", "C", "D", "E", "a", "b", "c", "d", "e"]
*/

示例4:正则表达式带g, 带有捕获组,有多个完整匹配

var str = ‘ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz‘;
var regexp = /A(BCD)*/gi;
var result = str.match(regexp);

/* result:
["ABCD", "abcd"]
*/

示例5: 不传参数

var str = ‘ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz‘;

var result = str.match();

/* result:
[
  "", 
  index: 0, 
  input: "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz", 
  groups: undefined
  ]
*/

2. RegExp.prototype.exec()

在一个指定字符串中执行一个搜索匹配。返回一个结果数组或 null。并会更新正则表达式对象的属性。

语法

regExp.exec(str)
param
  • str:要匹配正则表达式的字符串
return
  • 如果匹配成功:会返回一个数组,数组的第一项是进行匹配完整的字符串,之后的项是用圆括号捕获的结果;数组还会包含一个 index属性,其值为匹配结果中的完整字符串在原字符串中的索引;数组还会包含一个 input属性, 其值为原字符串。

  • 如果匹配失败:exec() 方法返回 null。

返回的结果和 str.match(regexp) 中regexp不带有g时的返回的结果是完全相同的。

对正则表达式对象属性的更新

对原正则表达式对象做了以下属性的更新:

  • lastIndex: 下一次匹配开始的位置。就是匹配的完整字符串之后的下一个字符的索引。当正则对象含有 "g" 时,可以在同一个正则对象上多次执行 exec 方法来查找同一个字符串中的多个成功匹配。查找将从正则表达式的 lastIndex 属性指定的位置开始。
  • ignoreCase: 是否使用了 "i" 标记使正则匹配忽略大小写
  • global:是否使用了 "g" 标记来进行全局的匹配.
  • multiline:
    是否使用了 "m" 标记使正则工作在多行模式(也就是,^ 和 $ 可以匹配字符串中每一行的开始和结束(行是由 或 分割的),而不只是整个输入字符串的最开始和最末尾处。)
  • source:正则表达式的字符串(不含igm标记)

示例1

var regexp = /quicks(brown).+?(jumps)/ig;
var str = ‘The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps‘;
var result1 = regexp.exec(str);

/* result1:
[
  "Quick Brown Fox Jumps", 
  "Brown", 
  "Jumps", 
  index: 4, 
  input: "The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps", 
  groups: undefined
]
*/

// regexp:
regexp.lastIndex;//25 (即Jumps后面的那个空格符)
regexp.ignoreCase;//true
regexp.global;//true
regexp.multiline;//false
regexp.source;//"quicks(brown).+?(jumps)"


var result2 = regex.exec(str);

//result2:
/*
 [
  "quick brown jumps", 
  "brown", 
  "jumps", 
  index: 45, 
  input: "The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps", 
  groups: undefined
]
*/

//regexp:
regexp.lastIndex;//62
regexp.ignoreCase;//true
regexp.global;//true
regexp.multiline;//false
regexp.source;//"quicks(brown).+?(jumps)"

3. String.prototype.search()

执行正则表达式和字符串之间的一个搜索匹配。返回字符串中首次完整匹配的索引或-1。

语法

str.match(regexp)
param
  • regexp: 一个正则表达式对象。如果传入一个非正则表达式对象,则会使用 new RegExp(obj) 隐式地将其转换为正则表达式对象。
return
  • 如果匹配成功:返回正则表达式在字符串中首次完整匹配的索引。
  • 如果匹配失败:返回 -1。

示例1:

var str = ‘ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz‘;
var regexp = /A(BCD)*/gi;
str.search(regexp); //0

4. RegExp.prototype.test()

执行一个检索,用来查看正则表达式与指定的字符串是否匹配。返回 true 或 false。

语法

regexp.test(str)
param
  • str: 用来与正则表达式匹配的字符串
return

Type Boolean.如果正则表达式与指定的字符串匹配 ,返回true;否则false。

5. String.prototype.replace

返回一个由替换值替换一些或所有匹配的模式后的新字符串。模式可以是一个字符串或者一个正则表达式, 替换值可以是一个字符串或者一个每次匹配都要调用的函数。原字符串不改变

语法

str.replace(regexp|substr, newSubStr|function)
params
  • pattern:
    • regexp: 一个RegExp对象或者RegExp字面量。该正则所匹配的内容会被第二个参数的返回值替换掉。
    • substr: 一个字符串。其会被第二个参数的返回值替换掉,由于该substr是被视为一个字符串而非正则,所以仅仅是第一个匹配会被替换。
  • replacement:
    • newSubStr: 用于替换掉第一个参数在原字符串中的匹配部分的字符串。该字符串中可以内插一些特殊的变量名。
    • function: 一个用来创建新子字符串的函数,该函数的返回值将替换掉第一个参数匹配到的结果。

newSubStr中可以插入的特殊变量名:

变量名 代表值
$$ ‘$‘
$& 匹配的子串
$` 当前匹配的子串左边的内容
$‘ 当前匹配的子串右边的内容
$n n为正整数,如果replace()方法的第一个参数是regexp,则表示第n个捕获组的匹配结果

function的参数:

变量名 代表值
match 匹配的子串。(对应于上述的$&。)
p1,p2, .. 如果replace()方法的第一个参数是一个RegExp,则代表第n个捕获组的匹配结果。(对应于上述的$1,$2等。)
offset 匹配到的子字符串在原字符串中的偏移量。(比如,如果原字符串是“abcd”,匹配到的子字符串是“bc”,那么这个参数将是1)
string 被匹配的原字符串。
return

匹配替换后的新字符串。原字符串不变。

示例1:使用function替换正则匹配结果

function replaceFunc(match, p1, p2, p3, offset, string) {
  return [p1, p2, p3].join(‘-‘);
}

var str = ‘abc12345#$*%‘;
var result = str.replace(/([^d]*)(d*)([^w]*)/, replaceFunc)//"abc-12345-#$*%"

示例2: 替换带有g标志的正则

var str = ‘Apples are round, and apples are juicy.‘; 
var result = str.replace(/apples/ig, ‘oranges‘);//‘oranges are round, and oranges are juicy‘.

示例3: 重组字符串中的多个子串

var str = ‘John Smith‘;
var result = str.replace(/(w+)s(w+)/,‘$2 and $1‘);//‘Smith and John‘

示例4: 将华氏温度转换为对应摄氏温度

function f2c(x)
{
  function convert(str, p1, offset, s)
  {
    return ((p1-32) * 5/9) + "C";
  }
  var s = String(x);
  var test = /(d+(?:.d*)?)F/g;
  return s.replace(test, convert);
}

示例5: 字符串去前后空格 经典!& 常用!

str.replace(/^s+|s+$/g, "");

二、常用匹配字符

1.字符类别

字符 含义
. 匹配任意单个字符,除了 u2028或u2029
d 匹配任意阿拉伯数字。等价于[0-9]
D 匹配任意不是阿拉伯数字的字符。等价于[^0-9]
w 匹配任意数字字母下划线。等价于[A-Za-z0-9_]
W 匹配任意不是数字字母下划线的字符。等价于[^A-Za-z0-9]
s 匹配一个空白符,包括空格、制表符、换页符、换行符、回车符合其他Unicode空格。等价于[ f vu00a0等等]
S 匹配一个非空白符
匹配一个水平制表符(tab)
匹配一个回车符(carriage return)
匹配一个换行符(linefeed)
v 匹配一个垂直制表符(vertical tab)
f 匹配一个换页符(form-feed)
[] 匹配一个退格符(backspace)(不要与  混淆)

2. 边界

字符 含义
^ 匹配输入开始。当有m标志时,将开始和结束字符(^和$)视为在多行上工作(也就是,分别匹配每一行的开始和结束(由 或 分割),而不只是只匹配整个输入字符串的最开始和最末尾处
$ 匹配输入结尾。 当有m标志时,将开始和结束字符(^和$)视为在多行上工作(也就是,分别匹配每一行的开始和结束(由 或 分割),而不只是只匹配整个输入字符串的最开始和最末尾处
 匹配一个零宽单词边界,如一个字母和一个空格之间。(不要和 [] 混淆)。例如,/no/ 匹配 "at noon" 中的 "no",/ly/ 匹配 "possibly yesterday." 中的 "ly"。
B 匹配一个零宽非单词边界,如两个字母之间或两个空格之间。例如, /Bon/匹配‘at noon‘中的‘on, /yeB/匹配‘possibly yesterday‘中的ye。

3. 断言

字符 含义
x(?=y) 仅匹配被y跟随的x。y可以是任意的正则字符组合。
x(?!y) 仅匹配不被y跟随的x。y可以是任意的正则字符组合。例如,举个例子,/d+(?!.)/ 只会匹配不被点(.)跟随的数字。

三. 验证常用正则表达式

1. 邮箱

简化版:

 /[email protected]S+.S+/

复杂版:

/^([A-Za-z0-9_-.])+@([A-Za-z0-9_-.])+.([A-Za-z]{2,4})$/

2. 用户名

用户名正则,4到16位(字母,数字,下划线,减号)

/^[a-zA-Z0-9_-]{4,16}$/

3. 满足一定强度的密码

最少6位,至少包括1个大写字母、1个小写字母、1个数字、1个特殊字符:

/^.*(?=.{6,})(?=.*d)(?=.*[A-Z])(?=.*[a-z])(?=.*[[email protected]#$%^&*? ]).*$/

检查某密码是否满足该强度:

var pattern=/^.*(?=.{6,})(?=.*d)(?=.*[A-Z])(?=.*[a-z])(?=.*[[email protected]#$%^&*? ]).*$/;
pattern.test(‘Ftc0615!#%^‘)//true

4. 手机号码正则

/^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))d{8}$/

5. 身份证号正则

/^[1-9]d{5}(18|19|([23]d))d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)d{3}[0-9Xx]$/

四、分组与捕获括号

括号分为 捕获分组括号,和 仅用于分组的非捕获型括号两种。

1.捕获/分组括号:(...)

普通的无特殊意义的括号通常有两种功能:分组和捕获。

捕获型括号的编号是按照 开括号的次序,从左到右计算的。

如果提供了反向引用,则这些括号内的子表达式匹配的文本可以在表达式的后面部分使用$1、$2来引用。

2.仅用于分组的括号/非捕获型括号:(?:...)

仅用于分组的括号不能用来提取文本,而只能用来规定多选结构或者量词的作用对象。

它们不会按照$1、$2编号。

Example:

    (1|one)(?:and|or)(2|two)

这样匹配之后,$1包含‘1‘或‘one‘,$2包含‘2‘或‘two‘

参考资料

https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/String/match
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp/exec
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/String/search
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp/test
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/String/replace

https://www.jb51.net/article/115170.htm

《精通正则表达式》







以上是关于JavaScript正则常用知识总结的主要内容,如果未能解决你的问题,请参考以下文章

JavaScript中 正则表达式的使用 及 常用正则表达式

常用Javascript代码片段集锦

javascript JS-常用代码片段

python常用代码片段总结

javascript常用代码片段

JavaScript全面知识总结:JS正则表达式+markdown语法+前端大厂面试题+项目实例