python 正则表达式re.sub()提取字符串以及去除空格

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 正则表达式re.sub()提取字符串以及去除空格相关的知识,希望对你有一定的参考价值。

参考技术A Python 的re模块提供了re.sub用于替换字符串中的匹配项。

语法:

re.sub(pattern, repl, string, count=0)

参数:

pattern : 正则中的模式字符串。

repl : 替换的字符串,也可为一个函数。

string : 要被查找替换的原始字符串。

count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。

实例:

注:re.sub(r'[a-zA-Z",:]', "", data),中括号表示选择其中的任意元素,a-zA-Z表示任意字母。

正则表达式re.sub

参考技术A re是regular expression的所写,表示正则表达式

sub是substitute的所写,表示替换;

re.sub是个正则表达式方面的函数,用来实现通过正则表达式,实现比普通字符串的replace更加强大的替换功能;

import re

print(re.sub(r"<span .*?>|</span>","","<span size=1>1</span><span font=sdf>2</span><span color=123>3</span>"))

运行结果:

123

re.sub共有五个参数。

re.sub(pattern, repl, string, count=0, flags=0)

其中三个必选参数:pattern, repl, string

两个可选参数:count, flags

pattern,表示正则中的模式字符串,这个没太多要解释的。

repl,就是replacement,被替换,的字符串的意思。

repl可以是字符串,也可以是函数。

import re;

def pythonReSubDemo():

    """

        demo Pyton re.sub

    """

    inputStr = "hello 123 world 456";

    def _add111(matched):

        intStr = matched.group("number"); #123

        intValue = int(intStr);

        addedValue = intValue + 111; #234

        addedValueStr = str(addedValue);

        return addedValueStr;

    replacedStr = re.sub("(?P<number>\d+)", _add111, inputStr);

    print "replacedStr=",replacedStr; #hello 234 world 567

string,即表示要被处理,要被替换的那个string字符串。

没什么特殊要说明。

举例说明:

继续之前的例子,假如对于匹配到的内容,只处理其中一部分。

以上是关于python 正则表达式re.sub()提取字符串以及去除空格的主要内容,如果未能解决你的问题,请参考以下文章

正则表达式re.sub替换不完整的问题现象及其根本原因

Python正则替换字符串函数re.sub用法示例

Python3 爬虫09_正则表达式(re.math()re.search()re.sub()全局匹配函数)

Python:re.sub()实现字符串替换

python 正则表达式 re.sub & re.subn

python re.sub详解