使用Python实现网站图片抓取

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Python实现网站图片抓取相关的知识,希望对你有一定的参考价值。

1,Python环境

技术分享图片

2,下面直接编写代码

import urllib
import re
import time

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
html = html.decode(‘utf-8‘)
return html

def getImgUrl(html):
str_re = r‘<img[^>]src[="‘]+([^"‘])["‘][^>]*>‘
imgre = re.compile(str_re,re.I)
imglist = re.findall(imgre,html)
for i in imglist:
urllib.urlretrieve(i,‘/mnt/test/‘+str(time.time())+".jpg")

#last setup is invocation and test it

html = getHtml(‘http://xxx.xxx.xxx‘)
getImgUrl(html)

以上是关于使用Python实现网站图片抓取的主要内容,如果未能解决你的问题,请参考以下文章

Python之多线程爬虫抓取网页图片

批量下载网站图片的Python小工具(下)

Python爬虫抓取网站模板的完整版实现

Python爬虫抓取网站模板的完整版实现

[Python爬虫] 之二十六:Selenium +phantomjs 利用 pyquery抓取智能电视网站图片信息

抓取新闻网站:异步爬虫实现的流程和细节