关于正则方法的一点理解

Posted 2020-09-08

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了关于正则方法的一点理解相关的知识，希望对你有一定的参考价值。

正则表达式
	1、元字符
	元字符是正则表达式的基础，比如\d--[0-9]数字字符，\D--[^0-9]非数字字符；还有转义符\f--换页，\n--换行；边界^--字符串起始位置,$--字符串结束位置，量词*--重复零次或更多 x>=0，+--重复一次或更多次 x>=1，?--重复零次或一次 x=(0\|\|1)
	{n}n次x=n，{n,} 重复n次或更多 x>=n，{n,m} 重复出现的次数比n多但比m少 n<=x<=m

	2、正则方法
	-> test
	语法: <regexp>.test( string ) -> boolean
	判断这个字符串是否符合这个正则表达式
	常用与验证
	-> exec
	语法: <regexp>.exec( string ) -> Array
	将匹配到的提取出来.
	1> 单个字符串提取
	/e/.exec( ‘abcdefg‘ ) -> [ ‘e‘ ]
	/h/.exec( ‘abcdefg‘ ) -> null
	2> 提取并解析( 常用 )
	分组: 在正则表达式中使用 () 可以将匹配的结果进行分组.
	学会分组的编号.
	1) 从左往右数左圆括号 (
	2) 依次从 1 开始给圆括号编号
	123 4 5 6
	/(((.)(.))(.)(.))/
	使用 exec 方法返回的是一个数组. 在匹配的结果中, 匹配到的字符串是数组的第 0 个元素.
	其中的每一组对应于数组的每一项.
	var r = /(((.)(.))(.)(.))/;
	var str = ‘abcd‘;
	r.exec( str );

	// [ 0 ]: 匹配到的结果: ‘abcd‘
	// [ 1 ]: 匹配到的第1组: ‘abcd‘
	// [ 2 ]: 匹配到的第2组: ‘ab‘
	// [ 3 ]: 匹配到的第3组: ‘a‘
	// ...
	Array[7]={0: "abcd",1: "abcd",2: "ab",3: "a",4: "b",5: "c",6: "d"}

	对路径的解析:
	/.:.*\\.+\..+/
	例如: c:\windows\system32\1.mp3
	.代表任意字符（C盘） : 对应盘符冒号 .*0次或多次尽量多的匹配（贪婪模式）所以从后面开始看
	.+1次或多次再往前\.转移字符.对应.mp3的"." 所以最后的.+对应mp3
	再往前.+ 1次或多次再往前\\转移字符\ 对应\1.mp3的"\"，所以 .+对应1
	最后中间的\windows\system32都属于.*


	// 贪婪模式, 所有 +, * 这类元字符都是尽可能多匹配
	/(.+)(.+)(.+)/
	/(.+)(.+)(.+)/.exec(‘abcdef‘)结果是
	Array[4]={0: "abcdef"，1: "abcd"，2: "e"，3: "f"}
	/(.+)(.+)(.+)/.exec(‘abcdef‘)[1]----"abcd"

	// 取消贪婪使用 ?
	/(.+?)(.+)(.+)/
	/(.+?)(.+)(.+)/.exec(‘abcdef‘)结果是
	Array[4]={0: "abcdef"，1: "a"，2: "bcde"，3: "f"}
	/(.+)(.+)(.+)/.exec(‘abcdef‘)[1]----"a"


	3> 循环提取所有
	‘abcdefgedgedg‘ // 将其中所有的 e 取出来
	操作:
	1) 在正则表达式中启用全局模式: /..../g, new RegExp( ‘...‘, ‘g‘ )
	2) 调用一次 exec 方法, 获取一个匹配项
	3) 再次调用 exec 方法, 获得下一个匹配项
	4) 如此往复, 没有匹配项的是否返回 null, 再次调用 exec 则匹配返回第一个匹配项

	var m;
	while ( ( m = r.exec( str ) ) != null ) {
	// m 就是每一次匹配到的结果
	}

	-> replace
	找出匹配项替换掉
	a、简单的替换：
	‘adCde‘.replace(/[A-Z]/g,-)------"ad-de"
	b、带回调函数的替换
	‘abCdeFg‘.replace(/[A-Z]/g,function(str){return str.toLowerCase()})----"abcdefg"
	在这里也可以用分组的思想解决部分难题：比如将‘abc-def-ghi-jk‘转换为‘abcDefGhiJk‘;
	我们需要去掉‘-‘还需要将之后的第一个字母变为大写；那我们可以这样
	‘abc-def-ghi-jk‘.replace(/-(.)/g,function(_,num1){return num1.toUpperCase()})---"abcDefGhiJk"
	这里参数和上面exec方法中的分组一样,"_"代表匹配的结果(由于不需要所有给_)，num1代表匹配到第一组，而且里面只有一个组(.)横线后的任意字母,返回值将字母转换为大写即可；
	再看看，如果同样的字符串我们需要把横线后第二个字母改为下划线"_"，我们可以这样
	‘abc-def-ghi-jk‘.replace(/(-.)(.)/g,‘$1_‘)----"abc-d_f-g_i-j_"
	在这里有需要注意的"$1"表示匹配到的第一个组，"$2"表示匹配到的第二个组；
	https://github.com/zxx2011509281/RegExp-.git

以上是关于关于正则方法的一点理解的主要内容，如果未能解决你的问题，请参考以下文章