用urllib爬取页面

Posted waterliang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用urllib爬取页面相关的知识,希望对你有一定的参考价值。

# 引入扩展
from urllib import request, error,  parse

# 定义url、请求头、请求参数
url = "http://www.baidu.com"
headers = {‘User-Agent‘: ‘Mozilla/5.0 3578.98 Safari/537.36‘}
data = {‘wd‘: ‘python‘}

#请求
data = parse.urlencode(data).encode(‘utf-8‘)
url = request.Request(url, headers=headers, data=data)
print(request.urlopen(url).read().decode(‘utf-8‘))

  

以上是关于用urllib爬取页面的主要内容,如果未能解决你的问题,请参考以下文章

02. 爬取get请求的页面数据

03.爬取get请求的页面数据

python网络爬虫《爬取get请求的页面数据》

爬虫学习 Python网络爬虫第三弹《爬取get请求的页面数据》

Python网络爬虫第三弹《爬取get请求的页面数据》

用bs4和urllib 爬取视频