Python 3 的 SGML 解析器?

Posted

技术标签:

【中文标题】Python 3 的 SGML 解析器?【英文标题】:SGML Parser for Python 3? 【发布时间】:2012-08-23 10:28:09 【问题描述】:

我有一些使用 SGML 构建的文档,并且我有一个描述这种结构的 DTD 文件。

有人可以向我推荐一个 Python-3 兼容的库或模块来解析这些数据吗?对于 Python 2.x,我的 Google-fu 似乎出现了 SGMLParser,但现在它当然已被弃用(并从 Py3k 中彻底删除)。

许多人似乎建议lxml,但由于依赖性问题,这对我来说不是一个选择。

我知道BeautifulSoup 非常适合用于杂乱的标记,但是 A) 上次我听说它不兼容 py3k,并且 B) 此内容结构良好。

【问题讨论】:

【参考方案1】:

BeautifulSoup 已弃用。请改用与 Py3k 兼容的替换:

BeautifulSoup4

【讨论】:

以上是关于Python 3 的 SGML 解析器?的主要内容,如果未能解决你的问题,请参考以下文章

python解析XML

XML, DTD, XSD, SGML

wikicfp.xml解析器python 3

Python 中最宽容的 HTML 解析器是啥?

网页解析器

Python之迭代器和列表解析