TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [关闭]

Posted

技术标签:

【中文标题】TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [关闭]【英文标题】:TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [closed] 【发布时间】:2011-07-08 05:05:23 【问题描述】:

可供选择(并坚持使用)的大量 html 解析器令人难以置信:

http://java-source.net/open-source/html-parsers

如何选择最符合以下要求的:

    成熟(bug 比其他人少) 活着和呼吸(即 维护) 快速且资源高效 (旨在在 android 上运行)

根据您的经验,您会推荐哪种 HTML 解析器(以满足上述要求)以及为什么?

【问题讨论】:

@George Bailey 谢谢。这是个很棒的资源。您正确理解我正在寻找适用于 Android 的 最佳 解决方案。即 Jsoup 在桌面/服务器上可能很棒,但对于手机来说,也许不同的软件包会更好。 更新:感谢@George Bailey 的链接,我找到了另一个资源:***.com/questions/3152138/… 您是否找到任何适合 Android 的合适的 html 解析器?我目前正在使用 JSoup。效果很好,但我想知道它是否可以进一步优化。 @Enigma AFAIAC Jsoup 是最好的。我可能不知道有什么更好的东西,但是项目生产力决定了我不能不断地从一个库切换到另一个库……:) 【参考方案1】:

嗯,我找到了答案,这是@BalusC 在different thread 上给出的:

    如果您只想使用基于 XML 的 遍历它的工具:JTidy。 如果您想对 HTML 进行单元测试: HtmlUnit 如果您想提取特定数据 来自 HTML:Jsoup

谢谢@BalusC。

【讨论】:

以上是关于TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

哪位大佬有vs2015及以上的安装包

[转]VS2010 常用插件

如何利用VS2010进行QT开发的环境配置

Win7下安装VS2017添加qt插件

VS2017安装步骤详解

已经有了vs2017离线包怎么安装