Python爬虫抓取煎蛋(jandan.net)无聊图

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫抓取煎蛋(jandan.net)无聊图相关的知识,希望对你有一定的参考价值。

 1 #!/usr/bin/python
 2 #encoding:utf-8
 3 ‘‘‘
 4 @python 3.6.1
 5 @author: [email protected]
 6 @create date: 20170611
 7 
 8 ‘‘‘
 9 import requests
10 import urllib
11 import re
12 import os
13 
14 #当前最大页数
15 url=http://jandan.net/pic
16 data=urllib.request.urlopen(url).read().decode(utf-8)
17 max_page_num=re.findall(r<span class.*current-comment-page.*?>\[(.*?)\]</span>,data)[1]
18 
19 def download_pic(start_page,stop_page,download_file):
20     for num in range(start_page,stop_page):
21         os.chdir(download_file)#图片保存目录
22         url=http://jandan.net/pic/page-%s % num
23         data=urllib.request.urlopen(url).read().decode(utf-8)
24         pics=re.findall(r<a href="//(.*?)" target.*?</a><br />,data, re.I|re.S|re.M)
25         for i in pics:
26             i=http://+i
27             r=requests.get(i)
28             pic_name=i[28:100]
29             with open(pic_name,wb) as f:
30                 f.write(r.content)
31                 f.close()
32 
33 if __name__==__main__:
34     print(当前最大页数为:  %s % max_page_num)
35     page1,page2=input(请输入要下载页数范围,例如     500,513 :).split(,)  
36     download_pic(int(page1),int(page2),rC:\Users\samsung\Desktop\jd_pics)
37     

 

以上是关于Python爬虫抓取煎蛋(jandan.net)无聊图的主要内容,如果未能解决你的问题,请参考以下文章

python3爬虫爬取煎蛋网妹纸图片

爬虫实例——爬取煎蛋网OOXX频道(反反爬虫——伪装成浏览器)

python爬取煎蛋网图片

Python:关于爬虫

如何使用nodejs做爬虫程序

如何使用nodejs做爬虫程序