python初尝试,写一个简单的爬虫程序
Posted 高疯疯疯
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python初尝试,写一个简单的爬虫程序相关的知识,希望对你有一定的参考价值。
1、首先因为mac自带python,版本为python2.7.10
2、安装pip,因为已经有了,所以不能用brew install。这里用sudo easy_install pip
3、安装beatifulsoup4,sudo -H pip install beautifulsoup4。 BeautifulSoup是一个可以从html或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.
4、安装html5lib,sudo pip install html5lib。html5lib是一种html解析库,其解析方式与浏览器一样
5、脚本代码:
from urllib2 import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.baidu.com")
res = BeautifulSoup(html.read(),"html5lib")
print(res.title)
6、结果:
以上就是今天的一个小尝试,记录一下。 学习起来也比较有动力~
以上是关于python初尝试,写一个简单的爬虫程序的主要内容,如果未能解决你的问题,请参考以下文章
Python3爬虫学习分布式爬虫第一步--Redis分布式爬虫初体验