python写个图片爬虫

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python写个图片爬虫相关的知识,希望对你有一定的参考价值。

[[email protected] pythonscript]# vim getimg.py 

#!/usr/bin/python

#encoding:utf8

import requests,sys,re

#定义一个方法,获取网站图片,并下载

def getimg(url):

    #请求url内容

    page=requests.get(url)

    #获取内容

    pagetext=page.content

    #定义正则表达式。

    reg=r‘src=.*?\.jpg‘

    #对获取的内容进行匹配

    imglist=re.findall(reg,pagetext)

    #为保存的图片文件命名

    imgname=1

    #循环获取带有src的url地址列表

    for x in imglist:

        #删除url中的前面src=字段

        x=x.lstrip(‘src="‘)

        try:

            #下载图片

            img=requests.get(x)

            #打开文件,由于imgname是用int递增,所以要使用str把imgname变成str。

            of=open(‘/root/‘+str(imgname)+".jpg",‘wb‘)

            #保存文件

            of.write(img.content)

            #关闭文件打开操作

            of.close()

            #文件名递增

            imgname+=1

        except IOError,e:

            print "url is error:"+str(e)

            #sys.exit(1)

            #发生错误忽略

            pass

#执行定义的函数

getimg(sys.argv[1])

执行方法:

python getimg.py  http://www.163.com


以上是关于python写个图片爬虫的主要内容,如果未能解决你的问题,请参考以下文章

如何自学Python爬虫技术

如何自学Python爬虫技术

Python-利用beautifulsoup写个豆瓣热门图书爬虫

Python爬虫新手教程:手机APP数据抓取 pyspider

Python爬虫入门教程 29-100 手机APP数据抓取 pyspider

Python爬虫入门教程 9-100 河北阳光理政投诉板块