java解析html是jsoup还是htmlparse还是其他的啥

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java解析html是jsoup还是htmlparse还是其他的啥相关的知识,希望对你有一定的参考价值。

参考技术A 用jsoup解析html或者htmlparse,不过比较难用,jsoup是jquery语法比较方便。 参考技术B

我还是觉得用jsoup来解析好,下面是我写的2篇关于Java爬虫解析HTML博客

http://www.sojson.com/tag_jsoup.html

Jsoup Java HTML 解析器:执行 Javascript 事件

【中文标题】Jsoup Java HTML 解析器:执行 Javascript 事件【英文标题】:Jsoup Java HTML parser : Executing Javascript events 【发布时间】:2011-11-12 17:48:44 【问题描述】:

我可以在 Jsoup 中填写表格、执行事件和 Javascript 函数吗?如果是,我该怎么办?或者我应该去找另一个解析器。

【问题讨论】:

你是如何解决这个问题的?你能得到你想要的吗 【参考方案1】:

JSoup 只是一个 HTML 解析器/“tidyfier”——不是浏览器模拟器。要与 HTML 页面进行交互(执行 javascript、填写表单等),您应该使用像 HtmlUnit 或 Selenium 这样的工具。

【讨论】:

好的好的。我有一个问题,我在 HTML 页面上有两个下拉菜单。更改一个下拉菜单时,另一个下拉菜单中的选项会更改。我想在 Java 代码中更改第一个下拉列表的值,然后在第二个下拉列表中获取新值,我该如何在 HTML 单元中进行呢?【参考方案2】:

使用 Selenium - 如果您使用 Selenium 2 WebDriver API,主要的类有 WebDriver、FirefoxDriver 和 JavascriptExecutor。

【讨论】:

以上是关于java解析html是jsoup还是htmlparse还是其他的啥的主要内容,如果未能解决你的问题,请参考以下文章

jsoup教程

jsoup入门

jsoup入门

JSoup——用Java解析html网页内容

Java爬虫利器HTML解析工具-Jsoup

Java 爬虫工具Jsoup解析