BeautifulSoup模块详细介绍

Posted 2022-08-19 jintian

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了BeautifulSoup模块详细介绍相关的知识，希望对你有一定的参考价值。

安装lxml，引擎（解析器）

soup=BeautifulSoup（html_doc,features="lxml"）

tag=soup.select(‘#link2‘)　　选择器的方式

tag.name　　获取标签名

children:儿子　标签和内容是不一样的类型

descendants:后代

clear:清空保留标签名　　decompose:删除，不保留标签名

extract:删除并有返回值（删除的标签）

encode:把对象转化为字节类型　　decode:把对象转化为字符串类型

recursive=True　　是否递归去找

soup.find(class_=‘ ‘)　　class写在attrs外面要加下划线避免与定义类class关键字冲突

. 是通配符除了换行符 \\n

tag.get(‘ id ‘)　　获取标签属性

www.cnblogs.com/wupeiqi/articles/6283017.html

is_empty_element　　是否空标签或自闭合标签

tag.string　　不仅可以获取还能修改，标签内容

创建标签：obj=Tag(name=‘div‘,attrs=‘id‘:‘it‘)

jquery.cuishifeng.cn　　jquery方法大全

tag.wrap(obj)　　将obj把tag标签包裹起来

tag.unwrap()　　去掉当前标签，保留其包裹的标签

技术图片

以上是关于BeautifulSoup模块详细介绍的主要内容，如果未能解决你的问题，请参考以下文章

Beautiful Soup模块

python beautiful soup库的超详细用法

Python技能树共建Beautiful Soup

BeautifulSoup模块详细介绍

爬虫学习笔记 Beautiful Soup使用

Beautiful Soup模块