Beautiful Stone Soup 在 XML 标记名称上区分大小写
Posted
技术标签:
【中文标题】Beautiful Stone Soup 在 XML 标记名称上区分大小写【英文标题】:Beautiful Stone Soup case sensitivity on XML tag names 【发布时间】:2011-12-19 19:41:24 【问题描述】:我正在尝试使用 Beautiful Stone Soup (BSS) 来修改具有区分大小写标签名称的现有 XML。当 BSS 读取 XML 时,它会将所有标记名称强制为小写,并且在将其写回文件时,我找不到恢复原始大写模式的简单方法。这会导致下游问题,因为输出 XML 不再针对模式进行验证(因为模式需要原始大写)。当我第一次阅读它时,我可以设置一个标志来告诉 BSS 将标签名称视为区分大小写吗?
【问题讨论】:
【参考方案1】:您是否尝试过ElementTree?毫无疑问,Beautiful Soup 非常适合从 html 中提取数据。但 ElementTree 几乎为 Python 处理 XML 设定了标准。
我已经有一段时间没有需要它了,但我不记得 ET 对我的标签名称做了任何不愉快的事情。
【讨论】:
在本次讨论之后我发现的其他内容 - 您可以从标准库中导入 cElementTree 而不是 ElementTree,这样更方便且运行速度更快。以上是关于Beautiful Stone Soup 在 XML 标记名称上区分大小写的主要内容,如果未能解决你的问题,请参考以下文章
python 之beautiful soup 4 warning