python正则表达式解析(re)

Posted python我的最爱

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python正则表达式解析(re)相关的知识,希望对你有一定的参考价值。

正则表达式的使用方法主要有4种: re.search(进行正则匹配), re.match(从头开始匹配)  re.findall(找出所有符合条件的字符列表)  re.split(根据条件进行切分)  re.sub(根据条件进行替换)

匹配规则里的符号

# . 可以被当作任意字符, re.M 忽略开头的换行符

res = re.match(^c.+d, cheng123ronghua, flags=re.M)
print(res)

# ^ 匹配当前字符串的开头, ^c表示已c开头,a$以a为结尾

res = re.search(^c[a-z]+a$, cdasda)
print(res.group())

# $ 表示结尾

res = re.search(r[a-zA-Z]+a$, cheng321ronGHua123aronghua)
print(res.group())

# * 表示匹配0个或者多个

print(re.findall(ab*, alexabbtomab))

# [‘a‘, ‘abb‘, ‘ab‘]

# + 表示匹配一个或者多个

print(re.findall(xd+a, alex123abc))

# [‘x123a‘]

# ? 匹配0个或者一个

print(re.findall(宋惠乔?, 宋惠 宋惠乔))

# [‘宋惠‘, ‘宋惠乔‘]

 # {1,3} 匹配一个到三个之间

print(re.findall([0-9]{1,3}, alex123alex1alex12))

# [‘123‘, ‘1‘, ‘12‘]

# | 进行或操作的匹配,匹配其中一个即可

print(re.search(abc|ABC, abcABCCD).group())

# abc

# 将需要匹配的字母进行统一的保存

string = re.search((abc){2}(||=){2}, 123abcabc||=||=)
print(string.group())

# abcabc||=||=

# A 表示以什么开头, 相当于上面的^ 

print(re.search(Aa.+b, a123b).group())

# a123b

#  表示以什么结尾,相当于上面的$ 

print(re.search(b.+d, 11b23d).group())

# b23d

# D 匹配非数字

print(re.search(D+, 123$-a).group())

# $-a

# w 匹配数字或者字母

print(re.search(w+ow+, the old tsoms).group())

# tsoms

# W 匹配非数字或者字母

print(re.search(W+, abc123%-%-%abc).group())

# %-%-%

# s 匹配空包字符  

print(re.findall(s+, sd 
 sd))

# [‘ 
 ‘]

# (?P<>[]+) 进行分组构造字典

A = re.search((?P<id>[0-9]+)(?P<name>[a-z]+), 123alex)
print(A.groupdict())

# {‘id‘: ‘123‘, ‘name‘: ‘alex‘}

# re.split() 进行数据切分

print(re.split([ ]+, 123  123 12))

# [‘123‘, ‘123‘, ‘12‘]

# re.sub 表示将数字进行替换| 

print(re.sub([0-9]+, |, acv1dae2dasd3ads))

# acv|dae|dasd|ads

# 进行反斜杠匹配 r‘\‘

print(re.split(r\, rabc123))

# [‘abc‘, ‘123‘]

# re.I 忽略大小写

print(re.search([a-z]+, abcA, re.I).group())

# abcA

# re.M 忽略开头的

print(re.search(^d123, 
d123456, flags=re.M).group())

# d123

# re.S 匹配所有的字符串,包括换行符

print(re.findall(rd.+s, d123

s123, flags=re.S))

# [‘d123

s‘]

 

这里编写了一个简单的计算器 

 

import re

s = 1-2*((60-30 +(9-2*5/3+7/3*99/4*2998+10*568/14)*(-40 / 5))-(-4*3)/(16-3*2))
s = s.replace( , ‘‘)
print(eval(s))
def get_grap(string):

    x = re.compile(([^()]+)).search(string)
    if x == None:
        return string
    else:
        return x.group()


def cal(x):
    if * in x:
        return float(x.split(*)[0]) * float(x.split(*)[1])
    else:
        return float(x.split(/)[0]) / float(x.split(/)[1])

def cal_sum(x):
    if + in x :
        return float(x.split(+)[0]) + float(x.split(+)[1])
    elif - in x:
        return float(x.split(-)[0]) - float(x.split(-)[1])

def cal_grap(x):
    # 找出其中的乘和除
    while True:
        y = re.compile(d+(.d+)?[*/]-?d+(.d+)?).search(x)
        if y == None:
            break
        y = y.group()
        x = x.replace(y, str(cal(y)))
    #找出其中的加减操作
    while True:
        if re.search([+][-], x) != None:
             x = re.sub([+][-], -, x)
        elif re.search([-][-], x) != None:
             x = re.sub([-][-], +, x)


        y = re.compile(-?d+(.d+)?[+-]d+(.d+)?).search(x)
        if y == None:
            break
        y = y.group()
        x = x.replace(y, str(cal_sum(y)))

    return x


while True:
    if re.compile(d+(.d+)?).search(s) != None:
        if re.compile(d+(.d+)?).search(s).group() == s:
            break

    x = get_grap(s)
    if re.search((.+), x) != None:
        all = cal_grap(x)[1:-1]
    else:
        all = cal_grap(x)
    s = s.replace(x, all)

print(s)

 

以上是关于python正则表达式解析(re)的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫--解析网页几种方法之正则表达式

Python-字符串解析-正则-re

python中的re模块

全网最全正则表达式系统讲解,实战练习,豆瓣案例解析(附讲解源代码)

爬虫解析Re 之(六 ) --- Re模块

python的re正则表达式模块学习