如何使用 python/django 从字符串中提取 url?(使用正则表达式)

Posted

技术标签:

【中文标题】如何使用 python/django 从字符串中提取 url?(使用正则表达式)【英文标题】:How do you extract a url from a string using python/django?(use regular expression) 【发布时间】:2017-05-12 21:32:51 【问题描述】:

string = "http://www.youtube.com/watchv=ClkQA2Lb_iE.......https://www.youtube.com/watch?v=ClkQA2Lb_iE, eeeeeee.www.youtube.com/watch?v=ClkQA2Lb_iE/vvvvvvvvvv---websitename.com:1234/dir/file.txt"

如何提取http://www.youtube.com,https://www.youtube.com,www.youtube.com,websitename.com

【问题讨论】:

【参考方案1】:
import re

s = 'http://www.youtube.com/watch?v=ClkQA2Lb_iE.......https://www.youtube.com/watch?v=ClkQA2Lb_iE, eeeeeee.www.youtube.com/watch?v=ClkQA2Lb_iE/vvvvvvvvvvv---websitename.com:1234/dir/file.txt'

sp2=re.findall(r'https?://+[\w.]+[\w.]|www+[\w.]+[\w.]|[\w]+[\w.](?:com)', str(s))
print sp2

【讨论】:

以上是关于如何使用 python/django 从字符串中提取 url?(使用正则表达式)的主要内容,如果未能解决你的问题,请参考以下文章