图片爬取百思不得姐(正则的取法,下载的方法,%s的用法)

Posted 张家欢。。

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图片爬取百思不得姐(正则的取法,下载的方法,%s的用法)相关的知识,希望对你有一定的参考价值。

# _*_coding:utf-8_*_
import urllib
import re
def geturl(page=1): #加了page参数
html=urllib.urlopen("http://www.budejie.com/pic/%s"%page).read() #%s对应后边的%page
reg=‘‘‘<img src="http://mstatic.spriteapp.cn/xx/1/w3/img/lazyload/default.png"
class="lazy"
data-original="(.*?)"‘‘‘ #多行正则的取法
reg= re.compile(reg)
photo=re.findall(reg,html)
return photo
r=0
for x in xrange(18):
print ‘获取第%s页‘%x
imglist = geturl(x+1)
for i in imglist:
r += 1 #r要有初始值
print ‘正在下载%s‘%r
urllib.urlretrieve(i,‘img/%s‘%i.split(‘/‘)[-1]) #切片取网址的最后一段 img存图片的文档名称 urllib.urlretrieve(下载的文件,存放地址)表示下载
print ‘%s下载完成‘%r
print ‘全部处理完成,总共抓取%s张图片‘%r

以上是关于图片爬取百思不得姐(正则的取法,下载的方法,%s的用法)的主要内容,如果未能解决你的问题,请参考以下文章

python爬取百思不得姐视频

百思不得姐框架

高仿百思不得姐(最新版4.5.6)

微信小程序实战之百思不得姐精简版

百思不得姐-笔记

百思不得姐框架