python3抓取超链接

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python3抓取超链接相关的知识,希望对你有一定的参考价值。

import re
import urllib.request
#(http://\S*?)[\"] 提取不带"
#http://\S*?[\"] 提取的时候带"
#\S非空字符 *0-多个 ?非贪婪 \"|>|)三个符号其中之一为结束
httpre=re.compile(r"(http://\S*?)[\"|>|)]",re.IGNORECASE)
for line in urllib.request.urlopen("http://www.baidu.com"):
line=line.decode("utf-8")
mylist = httpre.findall(line)
if mylist:
print(mylist)









以上是关于python3抓取超链接的主要内容,如果未能解决你的问题,请参考以下文章

Python3分析sitemap.xml抓取导出全站链接

HTML代码片段

HTML代码片段

Python正则匹配抓取豆瓣电影链接和评论代码分享

python web抓取代码不会打开链接

添加超链接时,VBA抛出错误1004