正则表达式的小总结

Posted 2020-07-29 码锋窝

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了正则表达式的小总结相关的知识，希望对你有一定的参考价值。

今天在项目中用到几个之前用的比较少一点的正则表达式，刚好有时间整理一下，可能有一些不常用到，但估计下面的在ios的开发中基本够用，分享给大家，废话不多，进入主题。

作用：

1.数据验证— 测试输入的字符串，是否符合一定的规则，如email地址，网址，QQ号，电话号码等

2.替换文本 — 识别文档的中的特定文本，例如：“”“\”之类的特殊字符。如：文章排版（添加空格，Tab等）

3.提取字符串 -- 提取一些特定的字符。

iOS中正则表达式的基本语法

首先，特殊符号’^‘和’$‘。他们的作用是分别指出一个字符串的开始和结束。

“^one”：表示所有以”one”开始的字符串（”one cat”，”one123″，·····）；

“a dog$”：表示所以以”a dog”结尾的字符串（”it is a dog”，·····）；

“^apple$”：表示开始和结尾都是”apple”的字符串，这个是唯一的~；

“banana”：表示任何包含”banana”的字符串。

　　‘*’，’+‘和’?‘这三个符号，表示一个或N个字符重复出现的次数。它们分别表示“没有或更多”（[0,+∞]取整），“一次或更多”（[1,+∞]取整），“没有或一次”（[0,1]取整）。下面是几个例子：

　　“ab*”：表示一个字符串有一个a后面跟着零个或若干个b（”a”, “ab”, “abbb”,……）；

　　“ab+”：表示一个字符串有一个a后面跟着至少一个b或者更多（ ”ab”, “abbb”,……）；

　　“ab?”：表示一个字符串有一个a后面跟着零个或者一个b（ ”a”, “ab”）；

　　“a?b+$”：表示在字符串的末尾有零个或一个a跟着一个或几个b（ ”b”, “ab”,”bb”,”abb”,……）。

　　可以用大括号括起来（{}），表示一个重复的具体范围。例如

　　“ab{4}”：表示一个字符串有一个a跟着4个b（”abbbb”）；

　　“ab{1,}”：表示一个字符串有一个a跟着至少1个b（”ab”,”abb”,”abbb”,……)；

　　“ab{3,4}”：表示一个字符串有一个a跟着3到4个b（”abbb”,”abbbb”)。

　　那么，“*”可以用{0，}表示，“+”可以用{1，}表示，“?”可以用{0，1}表示

　　注意：可以没有下限，但是不能没有上限！例如“ab{,5}”是错误的写法

　　“ | ”表示“或”操作：

　　“a|b”：表示一个字符串里有”a”或者”b”；

　　“(a|bcd)ef”：表示”aef”或”bcdef”；

　　“(a|b)*c”：表示一串”a”"b”混合的字符串后面跟一个”c”；

　　方括号”[ ]“表示在括号内的众多字符中，选择1-N个括号内的符合语法的字符作为结果，例如

　　“[ab]“：表示一个字符串有一个”a”或”b”（相当于”a|b”）；

　　“[a-d]“：表示一个字符串包含小写的’a‘到’d‘中的一个（相当于”a|b|c|d”或者”[abcd]“）；

　　“^[a-zA-Z]“：表示一个以字母开头的字符串；

　　“[0-9]a”：表示a前有一位的数字；

　　“[a-zA-Z0-9]$”：表示一个字符串以一个字母或数字结束。

　　“.”匹配除“\r\n”之外的任何单个字符：

　　“a.[a-z]“：表示一个字符串有一个”a”后面跟着一个任意字符和一个小写字母；

　　“^.{5}$”：表示任意1个长度为5的字符串；

　　“\num” 其中num是一个正整数。表示”\num”之前的字符出现相同的个数，例如

　　“(.)\1″：表示两个连续的相同字符。

　　“10\{1,2\}” : 表示数字1后面跟着1或者2个0 (“10″,”100″)。

　　” 0\{3,\} ” 表示数字为至少3个连续的0 （“000”，“0000”，······）。

　　在方括号里用’^‘表示不希望出现的字符，’^‘应在方括号里的第一位。

　　“@[^a-zA-Z]4@”表示两个”@”中不应该出现字母）。

常用的还有：

　　“ \d ”匹配一个数字字符。等价于[0-9]。

　　“ \D”匹配一个非数字字符。等价于[^0-9]。

　　“ \w ”匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]”。

　　“ \W ”匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。

　　iOS中书写正则表达式，碰到转义字符，多加一个“\”,例如：

　　全数字字符：@”^\\d\+$”

IOS常用正则表达式

正则表达式用于字符串处理、表单验证等场合，实用高效。现将一些常用的表达式收集于此，以备不时之需。

匹配中文字符的正则表达式： [\u4e00-\u9fa5]
评注：匹配中文还真是个头疼的事，有了这个表达式就好办了

匹配双字节字符(包括汉字在内)：[^\x00-\xff]
评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

匹配空白行的正则表达式：\n\s*\r
评注：可以用来删除空白行

匹配html标记的正则表达式：<(\S*?)[^>]*>.*?</\1>|<.*? />
评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧没有能力为力

匹配首尾空白字符的正则表达式：^\s*|\s*$
评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式

匹配Email地址的正则表达式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
评注：表单验证时很实用

匹配网址URL的正则表达式：[a-zA-z]+://[^\s]*
评注：网上流传的版本功能很有限，上面这个基本可以满足需求

匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注：表单验证时很实用

匹配国内电话号码：\d{3}-\d{8}|\d{4}-\d{7}
评注：匹配形式如 0511-4405222 或 021-87888822

匹配腾讯QQ号：[1-9][0-9]{4,}
评注：腾讯QQ号从10000开始

匹配中国邮政编码：[1-9]\d{5}(?!\d)
评注：中国邮政编码为6位数字

匹配身份证：\d{15}|\d{18}
评注：中国的身份证为15位或18位

匹配ip地址：\d+\.\d+\.\d+\.\d+
评注：提取ip地址时有用

匹配特定数字：
^[1-9]\d*$　　 //匹配正整数
^-[1-9]\d*$ 　 //匹配负整数
^-?[1-9]\d*$　　 //匹配整数
^[1-9]\d*|0$　 //匹配非负整数（正整数 + 0）
^-[1-9]\d*|0$　　 //匹配非正整数（负整数 + 0）
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$　　 //匹配正浮点数
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$　 //匹配负浮点数
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$　 //匹配浮点数
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$　　 //匹配非负浮点数（正浮点数 + 0）
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$　　//匹配非正浮点数（负浮点数 + 0）
评注：处理大量数据时有用，具体应用时注意修正

匹配特定字符串：
^[A-Za-z]+$　　//匹配由26个英文字母组成的字符串
^[A-Z]+$　　//匹配由26个英文字母的大写组成的字符串
^[a-z]+$　　//匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$　　//匹配由数字和26个英文字母组成的字符串
^\w+$　　//匹配由数字、26个英文字母或者下划线组成的字符串

英文字母:[a-zA-Z]

匹配中文，英文字母和数字及_:

^[\u4e00-\u9fa5_a-zA-Z0-9]+$

同时判断输入长度：
[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}

^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$ 1、一个正则表达式，只含有汉字、数字、字母、下划线不能以下划线开头和结尾：
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$ 其中：
^ 与字符串开始的地方匹配
(?!_)　　不能以_开头
(?!.*?_$)　　不能以_结尾
[a-zA-Z0-9_\u4e00-\u9fa5]+　　至少一个汉字、数字、字母、下划线
$　　与字符串结束的地方匹配

放在程序里前面加@，否则需要\\进行转义 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"
（或者：@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )

2、只含有汉字、数字、字母、下划线，下划线位置不限：

^[a-zA-Z0-9_\u4e00-\u9fa5]+$

3、由数字、26个英文字母或者下划线组成的字符串

^\w+$

4、2~4个汉字

@"^[\u4E00-\u9FA5]{2,4}$";

5.最长不得超过7个汉字，或14个字节(数字，字母和下划线)正则表达式

^[\u4e00-\u9fa5]{1,7}$|^[\dA-Za-z_]{1,14}$

7.匹配月份的正则表达式

^[1-9]$|^1[0-2]$

注：个位数月份匹配方式前面不能加 0。

^0?[1-9]$|^1[0-2]$

注：个位数月份前可以加0或者不加。

匹配年份19**或者20**

^(19|20)[0-9]{2}$

8.提取html中的超链接。

(]*)(href="https?:\/\/)((?!(?:(?:www\.)?‘.implode(‘|(?:www\.)?‘,$follow_list).‘))[^"]+)"((?!.*\brel=)[^>]*)(?:[^>]*)>

9.提取URL链接

^(f|ht){1}(tp|tps):\/\/([\w-]+\.)+[\w-]+(\/[\w-./?%&=]*)?

一个常用的在线测试工具：http://tool.oschina.net/regex/

以上是关于正则表达式的小总结的主要内容，如果未能解决你的问题，请参考以下文章