python正则表达式中的转义问题
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python正则表达式中的转义问题相关的知识,希望对你有一定的参考价值。
encode(‘string-escape‘) 解决
比如想匹配‘\x0e\x0a‘中的‘\x‘后的内容,这里希望把‘\x0e‘作为一个字符串,那么其中的\应该被转义。
未加转义的正则:
p = ‘(?<=\x)[0-9A-Za-z]{2}‘
直接这样写会报错,需要给\转义,于是变为
p = ‘(?<=\\x)[0-9A-Za-z]{2}‘
但由于使用的时候,会先将p的内容转义,然后匹配,所以又变成了\x和原始数据匹配,又会出错。解决:
p = ‘(?<=\\x)[0-9A-Za-z]{2}‘.encode(‘string-escape‘)
或者
p = ‘(?<=\\\\x)[0-9A-Za-z]{2}‘
测试代码:
import re a = "\\x0e\\x0b\\x0c" print a p = ‘(?<=\\x)[0-9A-Za-z]{2}‘.encode(‘string-escape‘) pattern = re.compile(p) m = pattern.findall(a) print m
输出:
\x0e\x0b\x0c [‘0e‘, ‘0b‘, ‘0c‘]
以上是关于python正则表达式中的转义问题的主要内容,如果未能解决你的问题,请参考以下文章