实例练习:正则表达式爬取百度贴吧照片
Posted vhhi
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了实例练习:正则表达式爬取百度贴吧照片相关的知识,希望对你有一定的参考价值。
代码出自小甲鱼,复盘,省略了图片的下载部分
正则真的太好用了,不过关键在你想不想的到最高效的正则表达式
1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 import urllib.request 4 import re 5 6 url = "https://tieba.baidu.com/p/6512141636" 7 8 def web(url): 9 response = urllib.request.urlopen(url) 10 html = response.read().decode(‘UTF-8‘,‘ignore‘) 11 test = r‘<img class="BDE_Image" src="([^"]+.jpg)"‘ 12 out = re.findall(test,html) 13 print(out) 14 web(url)
以上是关于实例练习:正则表达式爬取百度贴吧照片的主要内容,如果未能解决你的问题,请参考以下文章