BeautifulSoup的基本操作

Posted 康栋

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了BeautifulSoup的基本操作相关的知识,希望对你有一定的参考价值。

>>> from bs4 import BeautifulSoup   #导入

>>> soup = BeautifulSoup(url.content,"lxml") 

>>> print(soup.prettify) #格式化代价

>>> print(soup.title.string)
郑州轻工业学院OJ     #打印title

>>> print(soup.title)
<title>郑州轻工业学院OJ</title>

标签选择器:

>>> print(soup.a)
<a class="navbar-brand" href="./" style="font-weight:bold;">郑州轻工业学院OJ</a>

>> print(soup.title.name)
title

以zzuli的zcm网为抓取对象:

>>> print(soup.div.attrs[\'class\'])
[\'container\']
>>> print(soup.nav.attrs[\'class\'])
[\'navbar\', \'navbar-default\']
>>> print(soup.nav.attrs[\'role\'])
navigation

 

(可使用此方法获取标签后对应的内容)

其余的写法:

>>> print(soup.nav[\'role\'])
navigation

 

以上是关于BeautifulSoup的基本操作的主要内容,如果未能解决你的问题,请参考以下文章

BeautifulSoup 解析后返回间隔文本

CSS 选择器:BeautifulSoup4

使用 BeautifulSoup 解析未关闭的 `<br>` 标签

跟着知识追寻者学BeautifulSoup,你学不会打不还口,骂不还手

孤荷凌寒自学python第六十八天学习并实践beautifulsoup模块1

Python Beautiful Soup 解析库的使用