Python Pandas:如何替换包含“?”的字符串

Posted

技术标签:

【中文标题】Python Pandas:如何替换包含“?”的字符串【英文标题】:Python Pandas: How to replace string contain "?" 【发布时间】:2017-11-19 00:25:51 【问题描述】:

我有一个 Python 2.7 Pandas 数据框,如下所示:

Id      Title             URL
Id-1    Bruce Almighty    https://www.youtube.com/watch?v=5VGyTOGxyVA
Id-2    Superhero Movie   https://www.youtube.com/watch?v=3BnXz-7-y-o
Id-3    Taken             https://www.youtube.com/watch?v=vjbfiOERDYs
Id-4    Forest Gump       https://www.youtube.com/watch?v=eJFkCJySHdY&t=524s

我想用其他字符串替换部分字符串“?v=”,例如“URL”列中的“ppp”。我尝试了正常的替换命令:

df['URL'] = df['URL'].str.replace('?v=', 'ppp')

但出现以下错误。

error: nothing to repeat.

当我尝试只替换一个字符时,例如:

df['URL'] = df['URL'].str.replace('?', 'ppp')

它工作正常。为什么当我尝试替换字符串“?v =”时它不起作用?

【问题讨论】:

您尝试替换 '?=v' 而不是 '?v=' 谢谢。编辑错误 【参考方案1】:

您需要通过\ 转义?

df['URL'] = df['URL'].str.replace('\?v=', 'ppp')
print (df)
     Id            Title                                                URL
0  Id-1   Bruce Almighty        https://www.youtube.com/watchppp5VGyTOGxyVA
1  Id-2  Superhero Movie        https://www.youtube.com/watchppp3BnXz-7-y-o
2  Id-3            Taken        https://www.youtube.com/watchpppvjbfiOERDYs
3  Id-4      Forest Gump  https://www.youtube.com/watchpppeJFkCJySHdY&t=...

Series.replace 的另一个解决方案:

df['URL'] = df['URL'].replace('\?v=', 'ppp', regex=True)
print (df)
     Id            Title                                                URL
0  Id-1   Bruce Almighty        https://www.youtube.com/watchppp5VGyTOGxyVA
1  Id-2  Superhero Movie        https://www.youtube.com/watchppp3BnXz-7-y-o
2  Id-3            Taken        https://www.youtube.com/watchpppvjbfiOERDYs
3  Id-4      Forest Gump  https://www.youtube.com/watchpppeJFkCJySHdY&t=...

【讨论】:

谢谢。但是为什么当我尝试只替换“?”时它会起作用?角色? 因为它是特殊的正则表达式字符。检查this。【参考方案2】:

或者,您可以指示 Pandas 您正在执行标准(不是 RegEx)替换:

df['URL'] = df['URL'].str.replace('?v=', 'ppp', regex=False)

【讨论】:

以上是关于Python Pandas:如何替换包含“?”的字符串的主要内容,如果未能解决你的问题,请参考以下文章

python中,如何去掉字串自带的引号

Python Pandas:使用正则表达式用超链接替换字符串

Python pandas:替换 groupby 对象中的选择值

python pandas用数字替换数据框中的字符串

Pandas:替换字符串列值(等于、包含、大小写)

如何使用布尔掩码在 pandas DataFrame 中用 nan 替换“任何字符串”?