我想从python中数据框列中的字符串链接中删除子字符串
Posted
技术标签:
【中文标题】我想从python中数据框列中的字符串链接中删除子字符串【英文标题】:i want to remove a substring from a link of strings in a column of a dataframe in python 【发布时间】:2022-01-05 18:08:46 【问题描述】:df_bucket['Uri'].str.replace('www.','')
这些是数据框中的链接:
'https://www.durbine.com.bd/Upload/vimg/20211104/N20211104044257_270256_Jgh3eI3dJo7Lv2GuGiWswwwW.jpg', 'https://www.durbine.com.bd/Upload/vimg/20211104/N20211104044808_280753_miGVs4defXAMXcmFM1XJwwwX.jpg'
但结果是:
'https://durbine.com.bd/Upload/vimg/20211104/N20211104044257_270256_Jgh3eI3dJo7Lv2GuGiWs.jpg', 'https://durbine.com.bd/Upload/vimg/20211104/N20211104044808_280753_miGVs4defXAMXcmFM1XJ.jpg'
它还从最后一个删除 wwwX 和 wwwW。
【问题讨论】:
您好,您能解释一下您最终要提取的内容吗?例如,您是否尝试从 URL 中获取子字符串durbine
?
【参考方案1】:
您希望 www.
带有 literal 点,因此请在调用 str.replace
时关闭正则表达式:
df_bucket['Uri'].str.replace('www.', '', regex=False)
或者,如果您想在默认正则表达式模式下使用str.replace
,则使用反斜杠转义点:
df_bucket['Uri'].str.replace('www\.', '')
【讨论】:
以上是关于我想从python中数据框列中的字符串链接中删除子字符串的主要内容,如果未能解决你的问题,请参考以下文章