BeautifulSoup的选择器

Posted morein2008

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BeautifulSoup的选择器相关的知识,希望对你有一定的参考价值。

用BeautifulSoup查找指定标签(元素)的时候,有几种方法:

soup=BeautifulSoup(html)

1.soup.find_all(tagName),返回一个指定Tag元素的列表

2.soup.select(selector),返回一个指定Tag元素的列表,是非常好用的方法,它支持大部分css选择器(可在链接页面内查找"CSS选择器"相关章节),如类选择器,id选择器,子代选择器(但不支持直接子代选择器)

例如可以这样写,soup.select(‘.listConent div ul li‘),表示要查找class=‘listContent‘的某个标签下的div标签的ul标签下的所有li元素。

如果你想查找class=‘listContent‘的某个标签下的直接子代div标签,soup.select(‘.listConent > div‘),而jquery写成$(‘.listConent > div‘)

3.你可以逐层访问Tag的子标签[链接,可在链接页面内查找".contents 和 .children"章节],如 x.div.next_sibling.div.p.a.string

 

参考:

http://blog.csdn.net/fangwc/article/details/51192057

 

以上是关于BeautifulSoup的选择器的主要内容,如果未能解决你的问题,请参考以下文章

VSCode自定义代码片段——CSS选择器

VSCode自定义代码片段6——CSS选择器

BeautifulSoup的选择器

爬虫BeautifulSoup库基本使用,案例解析(附源代码)

在 BeautifulSoup 中扩展 CSS 选择器

如何将从 Chrome 复制的 css 选择器路径转换为 ​​beautifulsoup 对象?