Python爬虫抓取糗百的图片,并存储在本地文件夹
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫抓取糗百的图片,并存储在本地文件夹相关的知识,希望对你有一定的参考价值。
思路:
1.观察网页,找到img标签
2.通过requests和BS库来提取网页中的img标签
3.抓取img标签后,再把里面的src给提取出来,接下来就可以下载图片了
4.通过urllib的urllib.urlretrieve来下载图片并且放进文件夹里面(第一之前的准备工作就是获取当前路径然后新建一个文件夹)
5.如果有多张图片,不断的重复3-4
由于爬虫写得少,通过自己的调试,终于写了出来了
下面直接上代码:
1 #coding = ‘utf-8‘ 2 import requests 3 from bs4 import BeautifulSoup 4 import urllib 5 import os 6 import sys 7 reload(sys) 8 sys.setdefaultencoding("utf-8") 9 10 if __name__ == ‘__main__‘: 11 url = ‘http://www.qiushibaike.com/‘ 12 res = requests.get(url) 13 res.encoding = ‘utf-8‘ 14 soup = BeautifulSoup(res.text, ‘html.parser‘) 15 imgs = soup.find_all("img") 16 17 _path = os.getcwd() 18 new_path = os.path.join(_path , ‘pictures‘) 19 if not os.path.isdir(new_path): 20 os.mkdir(new_path) 21 new_path += ‘\\ ‘ 22 23 try: 24 x = 1 25 if imgs == []: 26 print "Done!" 27 for img in imgs: 28 link = img.get(‘src‘) 29 if ‘http‘ in link: 30 print "It‘s downloading %s" %x + "th‘s piture" 31 urllib.urlretrieve(link, new_path + ‘%s.jpg‘ %x) 32 x += 1 33 34 except Exception, e: 35 print e 36 else: 37 pass 38 finally: 39 if x : 40 print "It‘s Done!!!"
接下来上结果:
总结:
虽然一开始思路不清晰,而且对怎样把图片保存下来,都不是很熟
但是经过自己的思考,只要思路清楚了,确定了方向就好办了,至于函数不会用的话,可以直接百度查,很方便的
总而言之,写程序之前一定要有思路,边写边想思路是不行的,那样容易返工
不过最后还是写出来了,哈哈
也请大家来共同学习和指正
----------------------
转载的话请大家注明出处哦,谢谢了
以上是关于Python爬虫抓取糗百的图片,并存储在本地文件夹的主要内容,如果未能解决你的问题,请参考以下文章