python 简单爬虫

Posted sineik

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 简单爬虫相关的知识,希望对你有一定的参考价值。

使用urllib.request 和re 模块
1
from urllib.request import * 2 import re #处理网络访问 3 #获取网页 4 url = https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%C3%C0%C5%AE%CD%BC%C6%AC&fr=ala&ala=1&alatpl=adress&pos=0&hs=2&xthttps=111111 5 #打开网页 6 hmtl = urlopen(url) 7 #获取html代码 ,decode 解码 8 obj = hmtl.read().decode() 9 #使用re,找出所有的objURL链接 .*?匹配所有结果 10 urls = re.findall(r"objURL":"(.*?)",obj) 11 index = 1 12 for url in urls: 13 try: 14 if re.search(.jpg$,url): 15 print(downloading........%d%index) 16 urlretrieve(url,pic +str(index)+ .jpg) 17 else: 18 print(downloading........%d % index) 19 urlretrieve(url, pic + str(index) + .png) 20 index += 1 21 22 except Exception: 23 print(download error....%d%index) 24 else: 25 print(download complete)

 

爬取一张图片

使用requests 模块
1 import
requests 2 image_url = http://www.cnblogs.com/Images/Skins/BJ2008.jpg 3 response = requests.get(image_url) 4 with open(outlook.jpg,wb) as f: 5 f.write(response.content)

 




以上是关于python 简单爬虫的主要内容,如果未能解决你的问题,请参考以下文章

爬虫遇到头疼的验证码?Python实战讲解弹窗处理和验证码识别

Python练习册 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-),(http://tieba.baidu.com/p/2166231880)(代码片段

[Python]python爬虫简单试用

5行python代码实现简单的网络爬虫

如何用最简单的Python爬虫采集整个网站

python 用于在终端中运行的sublime text 3的简单代码片段制作工具