beautiful soup解析有空格的class

Posted life is tough,so are you

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了beautiful soup解析有空格的class相关的知识,希望对你有一定的参考价值。

用Python写一个爬虫,用BeautifulSoup解析html
其中一个地方需要抓取下面两类标签:

<dd class="ab " >blabla1</dd>
<dd class="ab cd" >blabla2</dd>

第一类class的值的末尾有一个空格。
第二类class的值中间有一个空格,而且开头部分和第一类相同。

在css中,class的值不应该有空格,所以第一类会忽略空格,第二类会被当做多值属性。参考官方文档多值属性。

所以在处理时也不需再考虑class值中的空格。

传入参数时用列表过滤器是最方便的,如下:

soup.find_all("dd", class_= ["ab", "cd"])

以上是关于beautiful soup解析有空格的class的主要内容,如果未能解决你的问题,请参考以下文章

4.2 使用 Beautiful Soup

Python Beautiful Soup 解析库的使用

用Beautiful Soup解析html源码

使用beautiful soup解析xml

Beautiful Soup常见的解析器

使用Beautiful Soup