python-爬网页

Posted 巅峰之斗

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python-爬网页相关的知识,希望对你有一定的参考价值。

import gevent
from urllib.request import urlopen


# 爬虫
def f(url):
print(‘GET: %s‘ % url)
resp = urlopen(url)
data = resp.read()

with open(‘baidu.html‘, ‘wb‘) as f:
f.write(data)

print(‘%d bytes %s‘ % (len(data), url))


# f(‘http://www.xiaohuar.com/‘)
f(‘http://www.baidu.com/‘)


# gevent.joinall([
#
# gevent.spawn(f, ‘https://www.python.org/‘),
# gevent.spawn(f, ‘https://www.yahoo.com/‘),
#
# ])

























以上是关于python-爬网页的主要内容,如果未能解决你的问题,请参考以下文章

python3 怎样爬取动态加载的网页信息

python小白学习记录 多线程爬取ts片段

python 爬网页 遇到重定向怎么处理

python网络爬虫之使用scrapy自动爬取多个网页

Python爬虫爬取动态网页

怎么用python爬虫爬取可以加载更多的网页