find_all的用法 Python(bs4,BeautifulSoup)

Posted wangyongfengxiaokeai

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了find_all的用法 Python(bs4,BeautifulSoup)相关的知识,希望对你有一定的参考价值。

find_all()简单说明:

find_all()

find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件

用法一:

rs=soup.find_all(‘a‘)

将返回soup中所有的超链接内容

类似的还有rs.find_all(‘span‘)、rs.find_all(‘title‘)、rs.find_all(‘h1‘)

也可加入查找条件,eg:

rs.find_all(‘img‘,{‘class‘:‘news-img‘})

将返回所有的class属性为news-img的img内容

用法二:

这里的true指的就是选中所有有id这个属性的标签

soup.find_all(id=True)

返回结果:

  [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, # <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, # <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

用法三:

soup.find_all("a", string="Elsie")

通过 string 参数可以搜搜文档中的字符串内容.与 name 参数的可选值一样, string 参数接受 字符串 , 正则表达式 , 列表, True

用法四:

soup.find_all("a", limit=2)

limit即为查找的数量,此处查找数量为两次

 

以上是关于find_all的用法 Python(bs4,BeautifulSoup)的主要内容,如果未能解决你的问题,请参考以下文章

在 BS4 中使用 find_all 获取文本作为列表

python爬虫rp+bs4

Python爬虫编程思想(56):Beautiful Soup方法选择器之find方法

python 学习之FAQ:find 与 find_all 使用

Python BS4.element.tag如何对此执行click()

python爬虫入门