实例练习:正则表达式爬取百度贴吧照片

Posted vhhi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了实例练习:正则表达式爬取百度贴吧照片相关的知识,希望对你有一定的参考价值。

  代码出自小甲鱼,复盘,省略了图片的下载部分

  正则真的太好用了,不过关键在你想不想的到最高效的正则表达式

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 import urllib.request
 4 import re
 5 
 6 url = "https://tieba.baidu.com/p/6512141636"
 7 
 8 def web(url):
 9     response = urllib.request.urlopen(url)
10     html = response.read().decode(UTF-8,ignore)
11     test = r<img class="BDE_Image" src="([^"]+.jpg)"
12     out = re.findall(test,html)
13     print(out)
14 web(url)

 

以上是关于实例练习:正则表达式爬取百度贴吧照片的主要内容,如果未能解决你的问题,请参考以下文章

爬虫实例林青霞女神照片爬取——百度贴吧

python爬虫入门练习,使用正则表达式和requests爬取LOL官网皮肤

正则表达式

python正则表达式——爬取网络小说实例

python 爬取淘宝的模特照片

Python爬虫实战之如何爬取百度贴吧帖子?案例详解