java中的html解析器[重复]

Posted

技术标签:

【中文标题】java中的html解析器[重复]【英文标题】:html parser in java [duplicate] 【发布时间】:2011-03-24 03:53:37 【问题描述】:

可能的重复:What html parsing libraries do you recommend in JavaNeed a good HTML parser on phpWhat are the pros and cons of the leading Java HTML parsers?

你好, 我用http://simplehtmldom.sourceforge.net/在php中解析html,有没有类似的东西......

【问题讨论】:

我认为该标题的“相关问题”中至少显示了 5 个相关问题。 【参考方案1】:

这里列出了一些:http://java-source.net/open-source/html-parsers 但是 JTidy 在 Java 开发人员中很受欢迎。

【讨论】:

【参考方案2】:

您可能对Mozilla Java Html Parser 感兴趣

【讨论】:

【参考方案3】:

您可以使用Jericho HTML Parser 或Mozilla Java Html Parser

【讨论】:

【参考方案4】:

TagSoup 解析器对我来说确实是一个不错的选择,因为根据作者的不同,HTML 并不总是格式正确的。 由于大多数解析器都期望格式良好的 xml(或 html,就此而言),我需要使用 TagSoup 以便能够解析提供给我的应用程序的所有 html。

【讨论】:

【参考方案5】:

恕我直言,Jsoup 是最好的 HTML 解析器

【讨论】:

以上是关于java中的html解析器[重复]的主要内容,如果未能解决你的问题,请参考以下文章

.Net中的HTML解析器[重复]

HashSet源码解析&Map迭代器

用于 Java 的 HTML/XML 解析器 [关闭]

Python中的JavaScript解析器[关闭]

Jsoup Java HTML 解析器:执行 Javascript 事件

如何为python安装解析器库[重复]