BeautifulSoup 用法

Posted 二郎神

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BeautifulSoup 用法相关的知识,希望对你有一定的参考价值。

一、标签选择器

1、子节点contents child(迭代器)

2、子孙节点 descendants(迭代器)

3、父节点 parent  

4、祖节点  parents

5、兄弟节点 next_siblings (下一个兄弟) previous_siblings(上一个兄弟)

二、标准选择器

1、find_all(name,attrs,recursive,text,**kwargs)

name

attrs        

text

 

2、find(name,attrs,recursive,text,**kwargs)

find返回单个元素,find_all返回所有元素

 

 

三、CSS选择器

通过select()直接传入css选择器就可以完成选择

 

获取属性

 

获取内容

 

总结

推荐使用lxml解析库,必要是使用html.parser

l 标签选择器筛选功能弱但是速度快

建议使用find(),find_all()查询匹配单个结果或者多个结果

如果对CSS选择器熟悉建议使用select

l 记住常用的获取属性和文本值得方法

以上是关于BeautifulSoup 用法的主要内容,如果未能解决你的问题,请参考以下文章

python之Beautiful Soup的基本用法

Python语言学习:Beautiful Soup四个对象的具体用法

beautiful soup的用法

Python爬虫利器二之Beautiful Soup的用法

8 Beautiful Soup的用法

python BeautifulSoup基本用法