通过完善邮箱匹配来一步步学习正则表达

Posted 2020-08-07 林六天

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了通过完善邮箱匹配来一步步学习正则表达相关的知识，希望对你有一定的参考价值。

首先，在学习之前先确定一下邮箱的格式，邮箱的一般格式为[email protected]，其中xxx可为数字、字母、下划线_，中划线-，点号.，加号+等组成。

在看具体代码之前需要先了解一些基础知识

# []表示匹配字符集中的任意一个字符
# \w 表示匹配任何字母数字字符
# \s表示任何空格字符
# \d表示任何十进制数字
# +表示匹配1次或多次前面出现的正则表达
# *表示匹配0次或多次前面出现的正则表达
# (?:)表示一个匹配不用保存的分组

1、匹配最简单的邮箱格式，如[email protected]

def test11():
    strs="liutian@126.com."
    reg="\[email protected]\w+.\w+"
    print re.match(reg,strs).group()

"\[email protected]\w+.\w+"的意思是：1次或多次的任何字母数字@1次或多次的字母数字.一次或多次的字母数字。
如此匹配不完善，经常会有的邮箱会有多个后缀。
2、完善匹配，如[email protected]

def test12():
    strs="[email protected]126.mygene.com

" reg="\[email protected](\w+.)+\w+" print re.match(reg,strs).group()

"\[email protected](\w+.)+\w+"，@后边的“(\w+.)+”的意思是将1个或多个任意字母或数字作为一个分组，1次或多次这个分组，也就是说一次或多次xxx.这样的形式。
如此匹配的话还是有遗漏，有的邮箱@前半部分是有特殊符号的，比如-_+.等，还需要包括这些。
3、邮箱包括特殊符号匹配，如[email protected]

def test13():
    strs="[email protected]"
    reg="\w+([-_+.]\w+)*\[email protected](\w+.)+\w+"
    print re.match(reg,strs).group()

4、如果@后边也有特殊符号呢，如[email protected]_ne.com

def test13():
    strs="[email protected]_ne.com"
    reg="\w+([-_+\.]\w+)*\[email protected]\w+([-_+\.]\w+)*\.\w+"
    print re.match(reg,strs).group()

需要注意的是，邮箱的结尾必定是.号跟字母或数字

以上是关于通过完善邮箱匹配来一步步学习正则表达的主要内容，如果未能解决你的问题，请参考以下文章

Python实现正则表达式匹配任意的邮箱

Python学习手册之正则表达式示例--邮箱地址提取

java的一个匹配多个邮箱的地址的正则表达式问题。

用正则表达式匹配邮箱

问一个关于邮箱的正则表达式

常用正则表达式（手机号邮箱URL地址身份证等等）