python正则表达式解析(re)
Posted python我的最爱
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python正则表达式解析(re)相关的知识,希望对你有一定的参考价值。
正则表达式的使用方法主要有4种: re.search(进行正则匹配), re.match(从头开始匹配) re.findall(找出所有符合条件的字符列表) re.split(根据条件进行切分) re.sub(根据条件进行替换)
匹配规则里的符号
# . 可以被当作任意字符, re.M 忽略开头的换行符
res = re.match(‘^c.+d‘, ‘cheng123ronghua‘, flags=re.M) print(res)
# ^ 匹配当前字符串的开头, ^c表示已c开头,a$以a为结尾
res = re.search(‘^c[a-z]+a$‘, ‘cdasda‘) print(res.group())
# $ 表示结尾
res = re.search(‘r[a-zA-Z]+a$‘, ‘cheng321ronGHua123aronghua‘) print(res.group())
# * 表示匹配0个或者多个
print(re.findall(‘ab*‘, ‘alexabbtomab‘)) # [‘a‘, ‘abb‘, ‘ab‘]
# + 表示匹配一个或者多个
print(re.findall(‘xd+a‘, ‘alex123abc‘)) # [‘x123a‘]
# ? 匹配0个或者一个
print(re.findall(‘宋惠乔?‘, ‘宋惠 宋惠乔‘)) # [‘宋惠‘, ‘宋惠乔‘]
# {1,3} 匹配一个到三个之间
print(re.findall(‘[0-9]{1,3}‘, ‘alex123alex1alex12‘)) # [‘123‘, ‘1‘, ‘12‘]
# | 进行或操作的匹配,匹配其中一个即可
print(re.search(‘abc|ABC‘, ‘abcABCCD‘).group()) # abc
# 将需要匹配的字母进行统一的保存
string = re.search(‘(abc){2}(||=){2}‘, ‘123abcabc||=||=‘) print(string.group()) # abcabc||=||=
# A 表示以什么开头, 相当于上面的^
print(re.search(‘Aa.+b‘, ‘a123b‘).group()) # a123b
# 表示以什么结尾,相当于上面的$
print(re.search(‘b.+d‘, ‘11b23d‘).group()) # b23d
# D 匹配非数字
print(re.search(‘D+‘, ‘123$-a‘).group()) # $-a
# w 匹配数字或者字母
print(re.search(‘w+ow+‘, ‘the old tsoms‘).group()) # tsoms
# W 匹配非数字或者字母
print(re.search(‘W+‘, ‘abc123%-%-%abc‘).group()) # %-%-%
# s 匹配空包字符
print(re.findall(‘s+‘, ‘sd sd‘)) # [‘ ‘]
# (?P<>[]+) 进行分组构造字典
A = re.search(‘(?P<id>[0-9]+)(?P<name>[a-z]+)‘, ‘123alex‘) print(A.groupdict()) # {‘id‘: ‘123‘, ‘name‘: ‘alex‘}
# re.split() 进行数据切分
print(re.split(‘[ ]+‘, ‘123 123 12‘)) # [‘123‘, ‘123‘, ‘12‘]
# re.sub 表示将数字进行替换|
print(re.sub(‘[0-9]+‘, ‘|‘, ‘acv1dae2dasd3ads‘)) # acv|dae|dasd|ads
# 进行反斜杠匹配 r‘\‘
print(re.split(r‘\‘, r‘abc123‘)) # [‘abc‘, ‘123‘]
# re.I 忽略大小写
print(re.search(‘[a-z]+‘, ‘abcA‘, re.I).group()) # abcA
# re.M 忽略开头的
print(re.search(‘^d123‘, ‘ d123456‘, flags=re.M).group()) # d123
# re.S 匹配所有的字符串,包括换行符
print(re.findall(r‘d.+s‘, ‘d123 s123‘, flags=re.S)) # [‘d123 s‘]
这里编写了一个简单的计算器
import re s = ‘1-2*((60-30 +(9-2*5/3+7/3*99/4*2998+10*568/14)*(-40 / 5))-(-4*3)/(16-3*2))‘ s = s.replace(‘ ‘, ‘‘) print(eval(s)) def get_grap(string): x = re.compile(‘([^()]+)‘).search(string) if x == None: return string else: return x.group() def cal(x): if ‘*‘ in x: return float(x.split(‘*‘)[0]) * float(x.split(‘*‘)[1]) else: return float(x.split(‘/‘)[0]) / float(x.split(‘/‘)[1]) def cal_sum(x): if ‘+‘ in x : return float(x.split(‘+‘)[0]) + float(x.split(‘+‘)[1]) elif ‘-‘ in x: return float(x.split(‘-‘)[0]) - float(x.split(‘-‘)[1]) def cal_grap(x): # 找出其中的乘和除 while True: y = re.compile(‘d+(.d+)?[*/]-?d+(.d+)?‘).search(x) if y == None: break y = y.group() x = x.replace(y, str(cal(y))) #找出其中的加减操作 while True: if re.search(‘[+][-]‘, x) != None: x = re.sub(‘[+][-]‘, ‘-‘, x) elif re.search(‘[-][-]‘, x) != None: x = re.sub(‘[-][-]‘, ‘+‘, x) y = re.compile(‘-?d+(.d+)?[+-]d+(.d+)?‘).search(x) if y == None: break y = y.group() x = x.replace(y, str(cal_sum(y))) return x while True: if re.compile(‘d+(.d+)?‘).search(s) != None: if re.compile(‘d+(.d+)?‘).search(s).group() == s: break x = get_grap(s) if re.search(‘(.+)‘, x) != None: all = cal_grap(x)[1:-1] else: all = cal_grap(x) s = s.replace(x, all) print(s)
以上是关于python正则表达式解析(re)的主要内容,如果未能解决你的问题,请参考以下文章