python 简单爬取图片

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 简单爬取图片相关的知识,希望对你有一定的参考价值。

现在的网站大多做了反爬处理,找一个能爬的网站还真不容易。

高清的图片很难爬,只能爬一些网站开始录目的小文件图片。

主要要做好隐藏。这里就做一个比较简单的代码试一试

 1 import urllib.request
 2 import re
 3 
 4 def gethtml(url):
 5     page=urllib.request.urlopen(url)
 6     html=page.read().decode(utf-8)
 7 
 8     return html
 9 
10 def getimg(html):
11     
12     a=re.compile(rsrc="(.+?\.jpg)")
13     tp=a.findall(html)
14     x=0
15     
16     for img in tp:
17         urllib.request.urlretrieve(img,d:/tupian/%s.jpg % x)
18         x+=1
19 
20     
21 url="http://www.meituba.com/yijing/28426.html"
22 
23 html=gethtml(url)
24 getimg(html)

关键是下级目录的高清大图就不能这样爬了,除了要使用for循环遍历url,还要模拟游览器访问。

这里就不说了,(笔记)

以上是关于python 简单爬取图片的主要内容,如果未能解决你的问题,请参考以下文章

python 简单爬取图片

python爬取优美图库海量图片,附加代码,一键爬取

Python——网络爬虫(爬取网页图片)

[python学习] 简单爬取图片站点图库中图片

Python爬虫入门:27270图片爬取

Python爬虫 自动爬取图片并保存