我想从python中数据框列中的字符串链接中删除子字符串

Posted

技术标签:

【中文标题】我想从python中数据框列中的字符串链接中删除子字符串【英文标题】:i want to remove a substring from a link of strings in a column of a dataframe in python 【发布时间】:2022-01-05 18:08:46 【问题描述】:
df_bucket['Uri'].str.replace('www.','')

这些是数据框中的链接:

'https://www.durbine.com.bd/Upload/vimg/20211104/N20211104044257_270256_Jgh3eI3dJo7Lv2GuGiWswwwW.jpg', 'https://www.durbine.com.bd/Upload/vimg/20211104/N20211104044808_280753_miGVs4defXAMXcmFM1XJwwwX.jpg'

但结果是:

'https://durbine.com.bd/Upload/vimg/20211104/N20211104044257_270256_Jgh3eI3dJo7Lv2GuGiWs.jpg', 'https://durbine.com.bd/Upload/vimg/20211104/N20211104044808_280753_miGVs4defXAMXcmFM1XJ.jpg'

它还从最后一个删除 wwwX 和 wwwW。

【问题讨论】:

您好,您能解释一下您最终要提取的内容吗?例如,您是否尝试从 URL 中获取子字符串 durbine 【参考方案1】:

您希望 www. 带有 literal 点,因此请在调用 str.replace 时关闭正则表达式:

df_bucket['Uri'].str.replace('www.', '', regex=False)

或者,如果您想在默认正则表达式模式下使用str.replace,则使用反斜杠转义点:

df_bucket['Uri'].str.replace('www\.', '')

【讨论】:

以上是关于我想从python中数据框列中的字符串链接中删除子字符串的主要内容,如果未能解决你的问题,请参考以下文章

如何从 Python 的数据框列中的字符串中删除非字母数字字符?

Pyspark 删除数据框列中的多个字符

如何使用模块 re 从数据框列中删除特殊字符? [复制]

如何从 pyspark 数据框列中的列表中删除特定字符串

如何删除数据框列中的空格并向其添加字符串“NA”?

从数据框列中的字符串值中删除字符