关于正则方法的一点理解

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于正则方法的一点理解相关的知识,希望对你有一定的参考价值。

正则表达式
  1、 元字符
  元字符是正则表达式的基础,比如\d--[0-9]数字字符,\D--[^0-9]非数字字符;还有转义符\f--换页,\n--换行;边界^--字符串起始位置,$--字符串结束位置,量词*--重复零次或更多 x>=0,+--重复一次或更多次 x>=1,?--重复零次或一次 x=(0||1)
  {n}n次x=n,{n,} 重复n次或更多 x>=n,{n,m} 重复出现的次数比n多但比m少 n<=x<=m
   
  2、正则方法
  -> test
  语法: <regexp>.test( string ) -> boolean
  判断这个字符串是否符合这个正则表达式
  常用与验证
  -> exec
  语法: <regexp>.exec( string ) -> Array
  将匹配到的提取出来.
  1> 单个字符串提取
  /e/.exec( ‘abcdefg‘ ) -> [ ‘e‘ ]
  /h/.exec( ‘abcdefg‘ ) -> null
  2> 提取并解析( 常用 )
  分组: 在 正则表达式中使用 () 可以将匹配的结果进行分组.
  学会分组的编号.
  1) 从左往右数 左圆括号 (
  2) 依次从 1 开始给 圆括号编号
  123 4 5 6
  /(((.)(.))(.)(.))/
  使用 exec 方法返回的是一个数组. 在匹配的结果中, 匹配到的字符串是数组的 第 0 个元素.
  其中的每一组对应于数组的每一项.
  var r = /(((.)(.))(.)(.))/;
  var str = ‘abcd‘;
  r.exec( str );
   
  // [ 0 ]: 匹配到的结果: ‘abcd‘
  // [ 1 ]: 匹配到的第1组: ‘abcd‘
  // [ 2 ]: 匹配到的第2组: ‘ab‘
  // [ 3 ]: 匹配到的第3组: ‘a‘
  // ...
  Array[7]={0: "abcd",1: "abcd",2: "ab",3: "a",4: "b",5: "c",6: "d"}
   
  对路径的解析:
  /.:.*\\.+\..+/
  例如: c:\windows\system32\1.mp3
  .代表任意字符(C盘) : 对应盘符冒号 .*0次或多次 尽量多的匹配(贪婪模式) 所以从后面开始看
  .+1次或多次 再往前\.转移字符.对应.mp3的"." 所以最后的.+对应mp3
  再往前.+ 1次或多次 再往前\\转移字符\ 对应\1.mp3的"\",所以 .+对应1
  最后中间的\windows\system32都属于.*
   
   
  // 贪婪模式, 所有 +, * 这类元字符都是尽可能多匹配
  /(.+)(.+)(.+)/
  /(.+)(.+)(.+)/.exec(‘abcdef‘)结果是
  Array[4]={0: "abcdef",1: "abcd",2: "e",3: "f"}
  /(.+)(.+)(.+)/.exec(‘abcdef‘)[1]----"abcd"
   
  // 取消贪婪使用 ?
  /(.+?)(.+)(.+)/
  /(.+?)(.+)(.+)/.exec(‘abcdef‘)结果是
  Array[4]={0: "abcdef",1: "a",2: "bcde",3: "f"}
  /(.+)(.+)(.+)/.exec(‘abcdef‘)[1]----"a"
   
   
  3> 循环提取所有
  ‘abcdefgedgedg‘ // 将其中所有的 e 取出来
  操作:
  1) 在正则表达式中启用全局模式: /..../g, new RegExp( ‘...‘, ‘g‘ )
  2) 调用一次 exec 方法, 获取一个匹配项
  3) 再次调用 exec 方法, 获得下一个匹配项
  4) 如此往复, 没有匹配项的是否返回 null, 再次调用 exec 则匹配返回第一个匹配项
   
  var m;
  while ( ( m = r.exec( str ) ) != null ) {
  // m 就是每一次匹配到的结果
  }
   
  -> replace
  找出匹配项替换掉
  a、简单的替换:
  ‘adCde‘.replace(/[A-Z]/g,-)------"ad-de"
  b、带回调函数的替换
  ‘abCdeFg‘.replace(/[A-Z]/g,function(str){return str.toLowerCase()})----"abcdefg"
  在这里也可以用分组的思想解决部分难题:比如将‘abc-def-ghi-jk‘转换为‘abcDefGhiJk‘;
  我们需要去掉‘-‘还需要将之后的第一个字母变为大写;那我们可以这样
  ‘abc-def-ghi-jk‘.replace(/-(.)/g,function(_,num1){return num1.toUpperCase()})---"abcDefGhiJk"
  这里参数和上面exec方法中的分组一样,"_"代表匹配的结果(由于不需要所有给_),num1代表匹配到第一组,而且里面只有一个组(.)横线后的任意字母,返回值将字母转换为大写即可;
  再看看,如果同样的字符串我们需要把横线后第二个字母改为下划线"_",我们可以这样
  ‘abc-def-ghi-jk‘.replace(/(-.)(.)/g,‘$1_‘)----"abc-d_f-g_i-j_"
  在这里有需要注意的"$1"表示匹配到的第一个组,"$2"表示匹配到的第二个组;
   https://github.com/zxx2011509281/RegExp-.git
   
 

以上是关于关于正则方法的一点理解的主要内容,如果未能解决你的问题,请参考以下文章

关于java中String的一点理解

关于Character的digit,forDigit,getNumericValue方法的一点理解

关于我对VXLAN的一点理解

关于Maven的一点理解

关于Django中间件自己的一点理解

关于引用的一点理解歧义