python3抓取超链接
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python3抓取超链接相关的知识,希望对你有一定的参考价值。
import re
import urllib.request
#(http://\S*?)[\"] 提取不带"
#http://\S*?[\"] 提取的时候带"
#\S非空字符 *0-多个 ?非贪婪 \"|>|)三个符号其中之一为结束
httpre=re.compile(r"(http://\S*?)[\"|>|)]",re.IGNORECASE)
for line in urllib.request.urlopen("http://www.baidu.com"):
line=line.decode("utf-8")
mylist = httpre.findall(line)
if mylist:
print(mylist)
以上是关于python3抓取超链接的主要内容,如果未能解决你的问题,请参考以下文章