Python爬虫编程思想（59）：用Beautiful Soup CSS选择器获取属性值与文本

Posted 2021-12-03 蒙娜丽宁

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python爬虫编程思想（59）：用Beautiful Soup CSS选择器获取属性值与文本相关的知识，希望对你有一定的参考价值。

由于select方法同样会返回Tag对象的集合，所以可以使用Tag对象的方式获取节点属性值和文本内容。获取属性值可以使用attrs，也可以直接使用[...]方式引用节点的属性。获取节点的文本内容可以使用get_text方法，也可以使用string属性。

下面的例子使用CSS选择器选取特定的a节点，并获取a节点的href属性值和文本内容。

from bs4 import BeautifulSoup
html = \'\'\'
<div>
    <ul>
        <li class="item1" value1="1234" value2 = "hello world">
            <a href="https://geekori.com"> geekori.com</a>
        </li>
        <li class="item">
           <a href="https://www.jd.com"> 京东商城</a>
           <a href="https://www.google.com">谷歌</a>
        </li>        
    </ul>
    <ul>
        <li class="item3"&g

以上是关于Python爬虫编程思想（59）：用Beautiful Soup CSS选择器获取属性值与文本的主要内容，如果未能解决你的问题，请参考以下文章

Python爬虫编程思想（59）： 用Beautiful Soup CSS选择器获取属性值与文本

Python爬虫编程思想（59）：用Beautiful Soup CSS选择器获取属性值与文本