爬虫beautiful soup笔记(待填坑)
Posted yesuuu
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫beautiful soup笔记(待填坑)相关的知识,希望对你有一定的参考价值。
Beautiful Soup是一个第三方的网页解析的模块。其遵循的接口为Document Tree,将网页解析成为一个树形结构。
其使用步骤如下:
1、创建对象:根据网页的文档字符串
2、搜索节点:名称、属性、文字。
3、处理节点:
BeautifulSoup(文档字符串, ‘html.parser‘ 解析器,from_encoding=‘utf8‘)
find_all(名称,属性,文字):可以传入字符串 也可以传入正则表达式。
node.name 名称
node[‘href‘] 属性
node.get_text 文字
以上是关于爬虫beautiful soup笔记(待填坑)的主要内容,如果未能解决你的问题,请参考以下文章
2017.08.11 Python网络爬虫实战之Beautiful Soup爬虫
Python爬虫编程思想(50):编写第一个Beautiful Soup程序
Python爬虫学习笔记.Beautiful Soup库的使用