10正则表达式

Posted 东京八十万萝莉总教头

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了10正则表达式相关的知识,希望对你有一定的参考价值。

1.简介
正则表达式是对字符串进行匹配的语法,像name like ‘%张%‘一样,定义了一些特殊的“元字符”,用来判断一个字符串是否满足某个规则。正则表达式非常深,编译器都是基于正则表达式,掌握基本使用即可。
2.基本元字符:

  • .表示除了\n以外的任意的单个字符
  • [0-9]表示的是0到9之间任何一个整数数字;[a-z]任意一个小写字母,[A-Z]任意一个大写字母
  • \d数字,\D非数字,\s空白,\S非空白,\w小写字母和数字和汉字,\W特殊符号。正则表达式中的\是真的\。
  • \表示对于.等特殊字符转义
  • ()提升优先级别和提取组
  • []代表一个区间中的任意一个[abc\d]就代表abc或者数字中的任意一个字符
  • | 或者
  • +是出现1次到无限次
  • *是出现0次到无限次
  • ?是出现0次到1次
  • {5}出现5次,{1,2}一次或两次,{5,8}为5至8次,{1,}最少一次,{3,}最少3次
  • ^以…开始,$以…结束

3.使用Regex.IsMatch(被匹配字符串, 正则表达式)判断是否匹配。C#中表示正则表达式最好前面加上@,可以避免转义带来的困扰。

4.常用

  • 这样写是有缺陷的Regex.IsMatch("18911111234", @"\d{11}")、Regex.IsMatch("3333333333333333", @"\d{11}"),应该使用^$改成Regex.IsMatch("18911111234333", @"^\d{11}$")
  • 手机号:@"^1\d{10}$"
  • @"^\d{5,10}$"匹配QQ号
  • ipv4地址:@"^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$" 正则表达式很难“一步到位”。192.168.1.15
  • @"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$" 匹配邮箱
  • [\u4e00-\u9fa5] 单个汉字 @"^[\u4e00-\u9fa5]{2,4}$" 长度为2-4的汉字姓名
  • 身份证号(15位、18位数字):@"^(\d{15})$|^(\d{18})$"
  • 身份证号(18位,最后一位可能是x) @"^(\d{17})[\dxX]$"
  • 日期格式:^\d{4}\-\d{1,2}\-\d{1,2}$

5.正则表达式:提取

Match match = Regex.Match("2016-5-15", @"^(\d{4})\-(\d{1,2})\-(\d{1,2})$");
//使用()获取“分组”
if(match.Success)
{
string year = match.Groups[1].Value;//序号从1开始
string month = match.Groups[2].Value;
string day = match.Groups[3].Value;
Console.WriteLine(year+","+month+","+day);
}
else
{
Console.WriteLine("不匹配");
}

 

以上是关于10正则表达式的主要内容,如果未能解决你的问题,请参考以下文章

通过 Java 正则表达式提取 semver 版本字符串的片段

text 正则表达式片段

markdown 正则表达式模式片段

正则表达式匹配特定的 URL 片段而不是所有其他 URL 可能性

攻破难啃的骨头-正则表达式(转)

正则表达式的贪婪和非贪婪模式