python正则表达式匹配一个空格分隔的所有单词对

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python正则表达式匹配一个空格分隔的所有单词对相关的知识,希望对你有一定的参考价值。

以下是代码:
import re

patt = r'(\w+)\s(\w+)'
str1 = 'as jk jsd eqwe dsads'
reg = re.compile(patt)

res = reg.findall(str1)
print res

结果是[('as', 'jk'), ('jsd', 'eqwe')],我想要的结果是[('as', 'jk'), ('jk','jsd'),('jsd', 'eqwe'),('eqwe','dsads')],求大神告知应该怎么改?

findall应该只能按着你的patten顺次往后找,所以出不来你想要的那种结果吧,倒不如直接用split分割然后写个循环输出你要的结果
import re

patt = r'\W+'
str1 = 'as jk jsd eqwe dsads'
reg = re.compile(patt)

res = reg.split(str1)
lst = []
for x in res:
if x:
length_flag = 0
else:
length_flag = 1
for x in range(0,len(res)-length_flag-1):
lst.append((res[x],res[x+1]))
print(lst)
输出结果就是你要的了
[('as', 'jk'), ('jk', 'jsd'), ('jsd', 'eqwe'), ('eqwe', 'dsads')]
我用的python3所以print带了括号,
另外我是个没啥基础刚自学的 方法可能非常笨拙
参考技术A 比如,一段文本:engliaasdddeiiiiideeeeef怎样在Python中用正则表达式提取出尖括号之外的内容?即最后的输出结果为engliaasdddeiiiiideeeeef

Python正则表达式,匹配最后一个单词

【中文标题】Python正则表达式,匹配最后一个单词【英文标题】:Python regular expression, matching the last word 【发布时间】:2015-09-08 06:46:07 【问题描述】:

我有以下问题。我正在寻找通常看起来像这样的字符串中的所有单词 HelloWorldToYou 请注意,每个单词都大写为开头,然后是下一个单词,依此类推。 我正在寻找从中创建单词列表。所以最终的预期输出是一个看起来像

的列表
['Hello','World','To','You']

在Python中,我使用了以下

mystr = 'HelloWorldToYou'
pat = re.compile(r'([A-Z](.*?))(?=[A-Z]+)')
[x[0] for x in pat.findall(mystr)]
['Hello', 'World', 'To']

但是,我无法捕捉到最后一个词“你”。有没有办法解决这个问题? 提前致谢

【问题讨论】:

看看@stribzhev 的例子。您遇到的问题是因为您的脚本正在寻找“您”之后没有大写字母的实例。 【参考方案1】:

使用与$ 的交替:

import re
mystr = 'HelloWorldToYou'
pat = re.compile(r'([A-Z][a-z]*)')
# or your version with `.*?`: pat = re.compile(r'([A-Z].*?)(?=[A-Z]+|$)')
print pat.findall(mystr)

见IDEONE demo

输出:

['Hello', 'World', 'To', 'You']

正则表达式解释

([A-Z][a-z]*) - 匹配的捕获组 [A-Z] 一个大写英文字母,后跟 [a-z]* - 小写英文字母的可选数量 -或- .*? - 懒惰地匹配换行符以外的任何字符

如果我们使用[a-z]*,则可以省略前瞻,但如果您使用.*?,则使用它:

(?=[A-Z]+|$) - 最多为大写英文字母(我们实际上可以在这里删除+),字符串结尾($)。

如果您不使用前瞻版本,您甚至可以删除捕获组以获得更好的性能和use finditer

import re
mystr = 'HelloWorldToYou'
pat = re.compile(r'[A-Z][a-z]*')
print [x.group() for x in pat.finditer(mystr)]

【讨论】:

以上是关于python正则表达式匹配一个空格分隔的所有单词对的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式 - 查找所有空格并忽略多行字符串中的连字符分隔的单词

Python 正则表达式将空格分隔的单词分隔成一个列表

《python核心编程》——正则表达式学习笔记(课后练习)

正则表达式匹配用括号括起来并用管道分隔的所有单词

正则表达式:匹配空格之间的单词

用于匹配单词的正则表达式,除非前一行以单词结尾