Python爬虫编程思想(54):使用Beautiful Soup选择兄弟节点
Posted 蒙娜丽宁
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫编程思想(54):使用Beautiful Soup选择兄弟节点相关的知识,希望对你有一定的参考价值。
除了子节点和父节点外,还有同级节点,也称为兄弟节点。可以通过next_sibling属性获得当前节点的下一个兄弟节点,通过previous_sibling属性获得当前节点的上一个兄弟节点。通过next_siblings属性获得当前节点后面所有的兄弟节点(返回一个可迭代对象),通过previous_siblings属性可以获得当前节点前面所有的兄弟节点(返回一个可迭代对象)。
这里要注意,如果两个节点之间有换行符或其他文本,那么这些属性也同样会返回这些文本节点,节点之间的文本将作为一个文本节点处理。文本节点是bs4.element.NavigableString类的实例,而普通节点是bs4.element.Tag类的实例。
现在以下面的html代码为例,说明文本节点和普通节点的区别。
<ul>
<li class="item1"><a href="https://www.jd.com"> 京东商城</a></li>
hello world
<li class="item2"><a href="htt
以上是关于Python爬虫编程思想(54):使用Beautiful Soup选择兄弟节点的主要内容,如果未能解决你的问题,请参考以下文章
Python爬虫编程思想(135):多线程和多进程爬虫--Python与线程
Python爬虫编程思想(135):多线程和多进程爬虫--Python与线程
Python爬虫编程思想(67): 使用pyquery修改节点
Python爬虫编程思想(127):使用Appium抓取移动数据--安装和配置Appium