图片爬取百思不得姐（正则的取法，下载的方法，%s的用法）

Posted 2020-08-20 张家欢。。

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了图片爬取百思不得姐（正则的取法，下载的方法，%s的用法）相关的知识，希望对你有一定的参考价值。

# _*_coding:utf-8_*_
import urllib
import re
def geturl(page=1): #加了page参数
    html=urllib.urlopen("http://www.budejie.com/pic/%s"%page).read()     #%s对应后边的%page
    reg=‘‘‘<img src="http://mstatic.spriteapp.cn/xx/1/w3/img/lazyload/default.png"
                 class="lazy"
                 data-original="(.*?)"‘‘‘     #多行正则的取法
    reg= re.compile(reg)
    photo=re.findall(reg,html)
    return photo
r=0
for x in xrange(18):
    print ‘获取第%s页‘%x
    imglist = geturl(x+1)
    for i in imglist:
        r += 1   #r要有初始值
        print ‘正在下载%s‘%r
        urllib.urlretrieve(i,‘img/%s‘%i.split(‘/‘)[-1]) #切片取网址的最后一段    img存图片的文档名称   urllib.urlretrieve(下载的文件，存放地址)表示下载
        print ‘%s下载完成‘%r
print ‘全部处理完成，总共抓取%s张图片‘%r

以上是关于图片爬取百思不得姐（正则的取法，下载的方法，%s的用法）的主要内容，如果未能解决你的问题，请参考以下文章