Python urllib爬取百度首页

Posted 杰神

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python urllib爬取百度首页相关的知识,希望对你有一定的参考价值。

官网下载安装python
在VS code里面安装python插件 https://www.cnblogs.com/bloglkl/archive/2016/08/23/5797805.html

  • cmd进入python输入
/*
没报错则证明urllib安装成功
*/
from urllib.request  import urlopen
  • 直接在cmd输入
pip install beautifulsoup4//安装beautifulsoup4
  • cmd进入python输入
/*
没报错验证beautifulsoup4安装
*/
from bs4 import BeautifuSoup
  • 爬取百度首页
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import io  
import sys
from urllib import request
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding=\'utf8\') #改变标准输出的默认编码  
resp = request.urlopen("http://www.baidu.com/")
print (resp.read().decode("utf-8"))

以上是关于Python urllib爬取百度首页的主要内容,如果未能解决你的问题,请参考以下文章

python网络爬虫《爬取get请求的页面数据》

Python网络爬虫第三弹《爬取get请求的页面数据》

爬虫学习 Python网络爬虫第三弹《爬取get请求的页面数据》

几行代码抓取百度首页

爬虫2 urllib3 爬取30张百度图片

Python基于urllib,re爬取百度的国内即时新闻