python正则表达式,这样的字符串怎么匹配?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python正则表达式,这样的字符串怎么匹配?相关的知识,希望对你有一定的参考价值。

import re
txt ="...cj([1,'zhangming']);zuobi;cj([2,'ligang']);cj([3,'lisan']);cj([4,'dashan']);zuobi..."
xingming = re.findall("怎么写???", txt)
print xingming
>>>["ligang", "lisan"]
txt文件很大,比如这段cj([1,'zhangming']);假如后面紧跟着字符串zuobi则不匹配这段中的zhangming,这段cj([2,'ligang']);后面没有zuobi则匹配字符串ligang,以此类推。

参考技术A 这里有一个矛盾。txt文件很大,有多大。能够放在内存里吗?如果不能够,则findall是不能使用的。
不过还是帮你写一个
xingmings=re.findall("(?isu)'([^']+?)'\]\);cj",txt) #查找所有除最后一个非zuobi姓名
xingming_last=re.search("(?isu)'([^']+?)'\]\);$",txt)
if xingming_last:xingmings.append(xingmings[1])本回答被提问者和网友采纳
参考技术B

根据提问者的问题,解答如下:

#查找所有除最后一个非zuobi姓名
xingmings=re.findall("(?isu)'([^']+?)'\\]\\);cj",txt) 
xingming_last=re.search("(?isu)'([^']+?)'\\]\\);$",txt)
if xingming_last:xingmings.append(xingmings[1])

第一行:查找所有满足条件的姓名,查找结果不包括txt的最后一个;

第二行:匹配txt的最后一个;

第三行:如果最后一个满足条件,则追加到xingmings中。

参考技术C 什么样的字符串?

python 正则表达式,怎样匹配以某个字符串开头,以某个字符串结尾的情况?

str ="abcdefg123213qwe"
比如要匹配以abc开头,以qwe结尾,要怎样写呢?

re.match(r"abc(qwe)$") 这样写得不到想要的结果。。
谢谢,如果需要截取中间这段的字符串“defg123213” 需要怎么写呢?

匹配以某个字符串开头,以某个字符串结尾的情况的正则表达式:^abc.*?qwe$

Python正则表达式的几种匹配用法:

1.测试正则表达式是否匹配字符串的全部或部分

regex=ur"" #正则表达式
if re.search(regex, subject):
do_something()
else:
do_anotherthing()

2.测试正则表达式是否匹配整个字符串

regex=ur"/Z" #正则表达式末尾以/Z结束
if re.match(regex, subject):
do_something()
else:
do_anotherthing()

3.创建一个匹配对象,然后通过该对象获得匹配细节(Create an object with details about how the regex matches (part of) a string)

regex=ur"" #正则表达式
match = re.search(regex, subject)
if match:
# match start: match.start()
# match end (exclusive): atch.end()
# matched text: match.group()
do_something()
else:
do_anotherthing()    

4.获取正则表达式所匹配的子串(Get the part of a string matched by the regex)

regex=ur"" #正则表达式
match = re.search(regex, subject)
if match:
result = match.group()
else:
result = ""    

5. 获取捕获组所匹配的子串(Get the part of a string matched by a capturing group)

regex=ur"" #正则表达式
match = re.search(regex, subject)
if match:
result = match.group(1)
else:
result = ""    

6. 获取有名组所匹配的子串(Get the part of a string matched by a named group)

regex=ur"" #正则表达式
match = re.search(regex, subject)
if match:
result = match.group"groupname")
else:
result = ""    

7. 将字符串中所有匹配的子串放入数组中(Get an array of all regex matches in a string)

result = re.findall(regex, subject)    

8.遍历所有匹配的子串(Iterate over all matches in a string)

for match in re.finditer(r"<(.*?)/s*.*?//1>", subject)
# match start: match.start()
# match end (exclusive): atch.end()
# matched text: match.group()    

9.通过正则表达式字符串创建一个正则表达式对象(Create an object to use the same regex for many operations)

reobj = re.compile(regex)    

10.用法1的正则表达式对象版本(use regex object for if/else branch whether (part of) a string can be matched)

reobj = re.compile(regex)
if reobj.search(subject):
do_something()
else:
do_anotherthing()    

11.用法2的正则表达式对象版本(use regex object for if/else branch whether a string can be matched entirely)

reobj = re.compile(r"/Z") #正则表达式末尾以/Z 结束
if reobj.match(subject):
do_something()
else:
do_anotherthing()

12.创建一个正则表达式对象,然后通过该对象获得匹配细节(Create an object with details about how the regex object matches (part of) a string)

reobj = re.compile(regex)
match = reobj.search(subject)
if match:
# match start: match.start()
# match end (exclusive): atch.end()
# matched text: match.group()
do_something()
else:
do_anotherthing()    

13.用正则表达式对象获取匹配子串(Use regex object to get the part of a string matched by the regex)

reobj = re.compile(regex)
match = reobj.search(subject)
if match:
result = match.group()
else:
result = ""    

14.用正则表达式对象获取捕获组所匹配的子串(Use regex object to get the part of a string matched by a capturing group)

reobj = re.compile(regex)
match = reobj.search(subject)
if match:
result = match.group(1)
else:
result = ""    

15.用正则表达式对象获取有名组所匹配的子串(Use regex object to get the part of a string matched by a named group)

reobj = re.compile(regex)
match = reobj.search(subject)
if match:
result = match.group("groupname")
else:
result = ""    

16.用正则表达式对象获取所有匹配子串并放入数组(Use regex object to get an array of all regex matches in a string)

reobj = re.compile(regex)
result = reobj.findall(subject)    

17.通过正则表达式对象遍历所有匹配子串(Use regex object to iterate over all matches in a string)

reobj = re.compile(regex)
for match in reobj.finditer(subject):
# match start: match.start()
# match end (exclusive): match.end()
# matched text: match.group()    

参考技术A 匹配以abc开头,以qwe结尾
if str.startswith("abc") and str.endswith("qwe"):
print str
截取中间这段的字符串

print re.sub(r"abc", '', re.sub("qwe", '', str))
参考技术B String regex = "^A*C*B$"; Pattern p = Pattern.compile(regex); java.util.regex.Matcher m = p.matcher("这里是你要匹配的字符串"); while (m.find()) System.out.println(m.group()); 参考技术C ^abc 表示 abc开头
qwe$ 表示qwe结尾
中间可以用.+?
参考技术D re.findall(r'(?<=abc).*(?=qwe)',str)
(?<=...)表示是以什么为开头的。。。但是不包换在结果中。
(?=...) 表示是以什么为结尾的。。。 但是不包含在结果中。

以上是关于python正则表达式,这样的字符串怎么匹配?的主要内容,如果未能解决你的问题,请参考以下文章

python 正则表达式怎么匹配

python 正则表达式,怎样匹配以某个字符串开头,以某个字符串结尾的情况?

怎么用正则表达式匹配中括号内的字符

正则表达式匹配文件类型

python下正则表达式的随笔记录

python 正则表达式 匹配指定字符