使用Python实现网站图片抓取
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Python实现网站图片抓取相关的知识,希望对你有一定的参考价值。
1,Python环境
2,下面直接编写代码
import urllib
import re
import time
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
html = html.decode(‘utf-8‘)
return html
def getImgUrl(html):
str_re = r‘<img[^>]src[="‘]+([^"‘])["‘][^>]*>‘
imgre = re.compile(str_re,re.I)
imglist = re.findall(imgre,html)
for i in imglist:
urllib.urlretrieve(i,‘/mnt/test/‘+str(time.time())+".jpg")
#last setup is invocation and test it
html = getHtml(‘http://xxx.xxx.xxx‘)
getImgUrl(html)
以上是关于使用Python实现网站图片抓取的主要内容,如果未能解决你的问题,请参考以下文章