Beautiful Stone Soup 在 XML 标记名称上区分大小写

Posted

技术标签:

【中文标题】Beautiful Stone Soup 在 XML 标记名称上区分大小写【英文标题】:Beautiful Stone Soup case sensitivity on XML tag names 【发布时间】:2011-12-19 19:41:24 【问题描述】:

我正在尝试使用 Beautiful Stone Soup (BSS) 来修改具有区分大小写标签名称的现有 XML。当 BSS 读取 XML 时,它会将所有标记名称强制为小写,并且在将其写回文件时,我找不到恢复原始大写模式的简单方法。这会导致下游问题,因为输出 XML 不再针对模式进行验证(因为模式需要原始大写)。当我第一次阅读它时,我可以设置一个标志来告诉 BSS 将标签名称视为区分大小写吗?

【问题讨论】:

【参考方案1】:

您是否尝试过ElementTree?毫无疑问,Beautiful Soup 非常适合从 html 中提取数据。但 ElementTree 几乎为 Python 处理 XML 设定了标准。

我已经有一段时间没有需要它了,但我不记得 ET 对我的标签名称做了任何不愉快的事情。

【讨论】:

在本次讨论之后我发现的其他内容 - 您可以从标准库中导入 cElementTree 而不是 ElementTree,这样更方便且运行速度更快。

以上是关于Beautiful Stone Soup 在 XML 标记名称上区分大小写的主要内容,如果未能解决你的问题,请参考以下文章

Beautiful Soup - 在 div 之后提取

python 之beautiful soup 4 warning

Beautiful Soup 4 find_all 找不到 Beautiful Soup 3 找到的链接

hdu 4781 Beautiful Soup 构造

Python爬虫学习Beautiful Soup库

hdu4872 Beautiful Soup 模拟