如何在 python 中 re.search() 多个模式?

Posted

技术标签:

【中文标题】如何在 python 中 re.search() 多个模式?【英文标题】:How to re.search() multiple patterns in python? 【发布时间】:2018-01-16 05:54:32 【问题描述】:

我有一个这样的列表:

['t__f326ea56',
 'foo\tbar\tquax',
 'some\ts\tstring']

我想得到这样的 4 个不同变量的结果:

s1 = 't__f326ea56'
s2 = ['foo', 'some']
s3 = ['bar', 's']
s4 = ['quax', 'string']

通常我可以搜索re.search(r'(.*)\t(.*)\t(.*)', lst).group(i) 来获取 s2、s3、s4。但是我不能同时搜索所有 4 个。re 模块中有什么特殊的选项可以使用吗?

谢谢

【问题讨论】:

【参考方案1】:

您可以在re 模块中使用split() 方法:

import re

s = ['t__f326ea56',
'foo\tbar\tquax',
'some\ts\tstring']

new_data = [re.split("\\t", i) for i in s]
s1 = new_data[0][0]

s2, s3, s4 = map(list, zip(*new_data[1:]))

输出:

s1 = 't__f326ea56'
s2 = ['foo', 'some']
s3 = ['bar', 's']
s4 = ['quax', 'string']

编辑:

对于列表列表:

s = [['t__f326ea56', 'foo\tbar\tquax', 'some\ts\tstring'], ['second\tbar\tfoo', 'third\tpractice\tbar']]

new_s = [[re.split("\\t", b) for b in i] for i in s]

new_s现在商店:

[[['t__f326ea56'], ['foo', 'bar', 'quax'], ['some', 's', 'string']], [['second', 'bar', 'foo'], ['third', 'practice', 'bar']]]

转置new_s中的数据:

new_s = [[b for b in i if len(b) > 1] for i in new_s]

final_s = list(map(lambda x: zip(*x), new_s))

final_s 现在将以您想要的原始方式存储数据:

[[('foo', 'some'), ('bar', 's'), ('quax', 'string')], [('second', 'third'), ('bar', 'practice'), ('foo', 'bar')]]

【讨论】:

谢谢我收到这个错误,ValueError: too many values to unpack (expected 3),当我在列表中运行它时。有什么想法吗? 有道理。谢谢! 很高兴能帮上忙!【参考方案2】:

使用“直”str.split()函数:

l = ['t__f326ea56', 'foo\tbar\tquax', 'some\ts\tstring']
items1, items2 = l[1].split('\t'), l[2].split('\t')
s1, s2, s3, s4 = l[0], [items1[0], items2[0]], [items1[1], items2[1]], [items1[2], items2[2]]
print(s1, s2, s3, s4)

输出:

t__f326ea56 ['foo', 'some'] ['bar', 's'] ['quax', 'string']

【讨论】:

以上是关于如何在 python 中 re.search() 多个模式?的主要内容,如果未能解决你的问题,请参考以下文章

在 python 列表中使用正则表达式(re.search)

python 中 re.match 和 re.search用法

Python3中正则模块re.compilere.match及re.search

Python中re.match与re.search的使用方法详解

Python3中正则模块re.compilere.match及re.search函数用法详解

python中的re.search()函数找不到子字符串