TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [关闭]
Posted
技术标签:
【中文标题】TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [关闭]【英文标题】:TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [closed] 【发布时间】:2011-07-08 05:05:23 【问题描述】:可供选择(并坚持使用)的大量 html 解析器令人难以置信:
http://java-source.net/open-source/html-parsers
如何选择最符合以下要求的:
-
成熟(bug 比其他人少)
活着和呼吸(即
维护)
快速且资源高效
(旨在在 android 上运行)
根据您的经验,您会推荐哪种 HTML 解析器(以满足上述要求)以及为什么?
【问题讨论】:
@George Bailey 谢谢。这是个很棒的资源。您正确理解我正在寻找适用于 Android 的 最佳 解决方案。即 Jsoup 在桌面/服务器上可能很棒,但对于手机来说,也许不同的软件包会更好。 更新:感谢@George Bailey 的链接,我找到了另一个资源:***.com/questions/3152138/… 您是否找到任何适合 Android 的合适的 html 解析器?我目前正在使用 JSoup。效果很好,但我想知道它是否可以进一步优化。 @Enigma AFAIAC Jsoup 是最好的。我可能不知道有什么更好的东西,但是项目生产力决定了我不能不断地从一个库切换到另一个库……:) 【参考方案1】:嗯,我找到了答案,这是@BalusC 在different thread 上给出的:
-
如果您只想使用基于 XML 的
遍历它的工具:JTidy。
如果您想对 HTML 进行单元测试:
HtmlUnit
如果您想提取特定数据
来自 HTML:Jsoup
谢谢@BalusC。
【讨论】:
以上是关于TagSoup vs. Jsoup vs. HTML Parser vs. HotSax vs [关闭]的主要内容,如果未能解决你的问题,请参考以下文章