java中的html解析器[重复]
Posted
技术标签:
【中文标题】java中的html解析器[重复]【英文标题】:html parser in java [duplicate] 【发布时间】:2011-03-24 03:53:37 【问题描述】:可能的重复:What html parsing libraries do you recommend in JavaNeed a good HTML parser on phpWhat are the pros and cons of the leading Java HTML parsers?
你好, 我用http://simplehtmldom.sourceforge.net/在php中解析html,有没有类似的东西......
【问题讨论】:
我认为该标题的“相关问题”中至少显示了 5 个相关问题。 【参考方案1】:这里列出了一些:http://java-source.net/open-source/html-parsers 但是 JTidy 在 Java 开发人员中很受欢迎。
【讨论】:
【参考方案2】:您可能对Mozilla Java Html Parser 感兴趣
【讨论】:
【参考方案3】:您可以使用Jericho HTML Parser 或Mozilla Java Html Parser
【讨论】:
【参考方案4】:TagSoup 解析器对我来说确实是一个不错的选择,因为根据作者的不同,HTML 并不总是格式正确的。 由于大多数解析器都期望格式良好的 xml(或 html,就此而言),我需要使用 TagSoup 以便能够解析提供给我的应用程序的所有 html。
【讨论】:
【参考方案5】:恕我直言,Jsoup 是最好的 HTML 解析器
【讨论】:
以上是关于java中的html解析器[重复]的主要内容,如果未能解决你的问题,请参考以下文章