python写个图片爬虫
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python写个图片爬虫相关的知识,希望对你有一定的参考价值。
[[email protected] pythonscript]# vim getimg.py
#!/usr/bin/python
#encoding:utf8
import requests,sys,re
#定义一个方法,获取网站图片,并下载
def getimg(url):
#请求url内容
page=requests.get(url)
#获取内容
pagetext=page.content
#定义正则表达式。
reg=r‘src=.*?\.jpg‘
#对获取的内容进行匹配
imglist=re.findall(reg,pagetext)
#为保存的图片文件命名
imgname=1
#循环获取带有src的url地址列表
for x in imglist:
#删除url中的前面src=字段
x=x.lstrip(‘src="‘)
try:
#下载图片
img=requests.get(x)
#打开文件,由于imgname是用int递增,所以要使用str把imgname变成str。
of=open(‘/root/‘+str(imgname)+".jpg",‘wb‘)
#保存文件
of.write(img.content)
#关闭文件打开操作
of.close()
#文件名递增
imgname+=1
except IOError,e:
print "url is error:"+str(e)
#sys.exit(1)
#发生错误忽略
pass
#执行定义的函数
getimg(sys.argv[1])
执行方法:
python getimg.py http://www.163.com
以上是关于python写个图片爬虫的主要内容,如果未能解决你的问题,请参考以下文章
Python-利用beautifulsoup写个豆瓣热门图书爬虫
Python爬虫新手教程:手机APP数据抓取 pyspider