python 正则表达式re.sub()提取字符串以及去除空格
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 正则表达式re.sub()提取字符串以及去除空格相关的知识,希望对你有一定的参考价值。
参考技术A Python 的re模块提供了re.sub用于替换字符串中的匹配项。语法:
re.sub(pattern, repl, string, count=0)
参数:
pattern : 正则中的模式字符串。
repl : 替换的字符串,也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
实例:
注:re.sub(r'[a-zA-Z",:]', "", data),中括号表示选择其中的任意元素,a-zA-Z表示任意字母。
正则表达式re.sub
参考技术A re是regular expression的所写,表示正则表达式sub是substitute的所写,表示替换;
re.sub是个正则表达式方面的函数,用来实现通过正则表达式,实现比普通字符串的replace更加强大的替换功能;
import re
print(re.sub(r"<span .*?>|</span>","","<span size=1>1</span><span font=sdf>2</span><span color=123>3</span>"))
运行结果:
123
re.sub共有五个参数。
re.sub(pattern, repl, string, count=0, flags=0)
其中三个必选参数:pattern, repl, string
两个可选参数:count, flags
pattern,表示正则中的模式字符串,这个没太多要解释的。
repl,就是replacement,被替换,的字符串的意思。
repl可以是字符串,也可以是函数。
import re;
def pythonReSubDemo():
"""
demo Pyton re.sub
"""
inputStr = "hello 123 world 456";
def _add111(matched):
intStr = matched.group("number"); #123
intValue = int(intStr);
addedValue = intValue + 111; #234
addedValueStr = str(addedValue);
return addedValueStr;
replacedStr = re.sub("(?P<number>\d+)", _add111, inputStr);
print "replacedStr=",replacedStr; #hello 234 world 567
string,即表示要被处理,要被替换的那个string字符串。
没什么特殊要说明。
举例说明:
继续之前的例子,假如对于匹配到的内容,只处理其中一部分。
以上是关于python 正则表达式re.sub()提取字符串以及去除空格的主要内容,如果未能解决你的问题,请参考以下文章