41 正则中匹配多个字符串匹配任意单个字符正则中使用字符串重复可选和特殊字符
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了41 正则中匹配多个字符串匹配任意单个字符正则中使用字符串重复可选和特殊字符相关的知识,希望对你有一定的参考价值。
第三课 正则中匹配多个字符串
# 匹配多个字符串
# 择一匹配符号, |
import re
s = ‘Python|Ruby|Java|Swift‘
m = re.match(s,‘PythonRuby‘)
print(m) # <re.Match object; span=(0, 6), match=‘Python‘>
m = re.search(s, ‘I love Python.‘)
print(m) # <re.Match object; span=(7, 13), match=‘Python‘>
m = re.search(s, ‘I love Java.‘)
print(m) # <re.Match object; span=(7, 11), match=‘Java‘>
----------------------------
第四课 正则中匹配任意单个字符
# 匹配任意单个字符
# 点(.):可以匹配任意单个字符
‘‘‘
match(‘.ind‘,‘-ind‘)
‘\.ind‘ ‘bind‘
‘‘‘
import re
s = ‘bin.‘
m = re.match(s, ‘binxa‘)
if m is not None:
print(m.group()) # binx
m = re.search(s, ‘<bind>‘)
print(m.group()) # bind
s1 = ‘3.14‘
s2 = ‘3\.14‘ # 这个只能匹配 3.14
m = re.match(s1, ‘3.14‘)
print(m) # <re.Match object; span=(0, 4), match=‘3.14‘>
m = re.match(s1, ‘3314‘)
print(m) # <re.Match object; span=(0, 4), match=‘3314‘>
m = re.match(s2, ‘3.14‘)
print(m) # <re.Match object; span=(0, 4), match=‘3.14‘>
m = re.match(s2, ‘3514‘)
print(m) # None
第五课 正则中使用字符串
主要针对单个字符有多个选择
# [abcd] 表示 或者是a 或者是b 或者是c 或者是d
# 使用字符集
# [abcd] abc|b|c|d
import re
m = re.match(‘[abcd]‘,‘a‘)
print(m) # <re.Match object; span=(0, 1), match=‘a‘>
print(re.match(‘a|b|c|d‘,‘a‘)) # <re.Match object; span=(0, 1), match=‘a‘>
print(re.match(‘[abcd]‘,‘ab‘)) # <re.Match object; span=(0, 1), match=‘a‘>
print(re.match(‘ab|cd‘,‘ab‘)) # <re.Match object; span=(0, 2), match=‘ab‘>
print(re.match(‘[ab][cd][ef][gh]‘,‘adfh‘)) # <re.Match object; span=(0, 4), match=‘adfh‘>
print(re.match(‘[ab][cd][ef][gh]‘,‘abceh‘)) # None
-------------------------
第六课 正则中重复、可选和特殊字符
# 重复、可选和特殊字符
‘‘‘
*:0到n a* 空字符串 a aa aaa 表示*修复的字符串 0到n次
+:1到n a+ a aa aaa 表示+修复的字符串 1到n次 至少有一个
?:可选 a? 空字符串 a 表示修复的字符串可有可无
‘‘‘
‘‘‘
匹配‘a‘ ‘b‘ ‘c‘三个字母按顺序从左到右排列,而且这3个字母都必须至少有1个
abc aabc abbbccc bca(不匹配)
‘‘‘
import re
s = ‘a+b+c+‘ # 同时满足 三个字母按顺序并且至少有1个
strList = [‘abc‘,‘aabc‘,‘bbabc‘,‘aabbbcccxyz‘]
for value in strList:
m = re.match(s,value)
if m is not None:
print(m.group())
else:
print(‘{}不匹配{}‘.format(value,s))
结果为:
abc
aabc
bbabc不匹配a+b+c+
aabbbccc
# 匹配前面任意3个数字-后面任意3个小写字母
‘‘‘
123-abc 543-xyz 1-xyz(不匹配) xyz-123(不匹配)
[0-9] 表示任意一个数字
\d 表示任意一个数字
\d\d\d 任意3个数字
[a-z] 任意一个小写字母
[a-z][a-z][a-z] 任意3个字母
[A-Z] 任意一个大写字母
{n}
\d{3} 表示任意出现3此数字
[a-z]{3} 表示一个出现3此字母
‘‘‘
print(‘-------------‘)
s = ‘\d{3}-[a-z]{3}‘
strList = [‘123-abc‘,‘456-xyz‘,‘1234-xyz‘,‘1-xyzabc‘,‘657-xyz^%abc‘]
for value in strList:
m = re.match(s,value)
if m is not None:
print(m.group())
else:
print(‘{}不匹配{}‘.format(value,s))
结果为:
123-abc
456-xyz
1234-xyz不匹配\d{3}-[a-z]{3}
1-xyzabc不匹配\d{3}-[a-z]{3}
657-xyz
‘‘‘
匹配以a到z的26个字母中的任意一个作为前缀(也可以没有这个前缀),后面至少有1个数字
‘‘‘
print(‘-------‘)
s = ‘[a-z]?\d+‘
strList = [‘1234‘,‘a123‘,‘ab456‘,‘b234abc‘]
for value in strList:
m = re.match(s,value)
if m is not None:
print(m.group())
else:
print(‘{}不匹配{}‘.format(value,s))
结果为:
1234
a123
ab456不匹配[a-z]?\d+
b234
‘‘‘
匹配email
\w 表示任意一个字符,包括小写的大写的字母和数字 也能匹配汉子 不包括连字符和特殊的字符
\w+ 表示任意一个字符,包括小写的大写的字母和数字 至少有一个 不能为空
[a-zA-Z0-9] 表示:只能是字母小写大写和数字
‘‘‘
print(‘-------‘)
email = ‘\w+@(\w+\.)*\w+\.com‘
emailList = [‘abc@126.com‘,‘test@mail.geeori.com‘,‘test-abc@geekori.com‘,‘abc@geekori.com.cn‘]
for value in emailList:
m = re.match(email,value)
if m is not None:
print(m.group())
else:
print(‘{}不匹配{}‘.format(value,email))
结果为:
abc@126.com
test@mail.geeori.com
test-abc@geekori.com不匹配\w+@(\w+\.)*\w+\.com
abc@geekori.com
strValue = ‘我的email是lining@geekori.com,请发邮件到这个email‘
m = re.search(email,strValue)
print(m) # <re.Match object; span=(0, 26), match=‘我的email是lining@geekori.com‘>
email = ‘[a-zA-Z0-9]+@(\w+\.)*\w+\.com‘
m = re.search(email,strValue)
print(m) # <re.Match object; span=(8, 26), match=‘lining@geekori.com‘>
print(m.group()) # lining@geekori.com
以上是关于41 正则中匹配多个字符串匹配任意单个字符正则中使用字符串重复可选和特殊字符的主要内容,如果未能解决你的问题,请参考以下文章