使用 BeautifulSoup 创建 XML 文档

Posted

技术标签:

【中文标题】使用 BeautifulSoup 创建 XML 文档【英文标题】:Creating an XML document with BeautifulSoup 【发布时间】:2013-04-24 16:57:06 【问题描述】:

在我看到的关于 BeautifulSoup 的所有示例和教程中,传递了一个 html/XML 文档并返回了一个可以用来修改文档的汤对象。但是,如何使用 BeautifulSoup 从头开始​​创建 HTML/XML 文档?换句话说,我有想要放入 XML 文件的数据,但 XML 文件还不存在,我想从头开始构建它。我该怎么办?

【问题讨论】:

【参考方案1】:

只需创建一个空的BeautifulSoup() 对象:

soup = BeautifulSoup()

并开始添加元素:

soup.append(soup.new_tag("a", href="http://www.example.com"))

对于 XML,您可以使用 xml 树构建器从 XML 标头开始:

soup = BeautifulSoup(features='xml')

这需要先安装lxml。这会在BeautifulSoup 对象上设置.is_xml 标志(也可以手动设置)。

【讨论】:

对于 XML 文档呢?在创建 BeautifulSoup 对象时,相同的代码会起作用还是需要指定不同的解析器?

以上是关于使用 BeautifulSoup 创建 XML 文档的主要内容,如果未能解决你的问题,请参考以下文章

Python 爬虫-BeautifulSoup

BeautifulSoup实现博文简介与过滤恶意标签(xxs攻击)

使用beautifulsoup4进行xml解析,命名空间问题

如何使用 BeautifulSoup 访问命名空间的 XML 元素?

python 使用BeautifulSoup解析XML

使用 BeautifulSoup 迭代 XML 以提取特定标签并存储在变量中