jsoup: Java HTML Parser

Posted xiaoCong2015

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了jsoup: Java HTML Parser相关的知识,希望对你有一定的参考价值。

jsoup  Java html Parser

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据

HTMLParser 太小众,连官方文档都太少,中文的更少

不知道jsoup是不是把整个页面都解析成DOM树了,如果是这样可能会有一点点慢,同事说他那个爬新浪页面的爬虫项目,用jsoup满足得了客户需求
jsoup把整个页面都解析成DOM树






















以上是关于jsoup: Java HTML Parser的主要内容,如果未能解决你的问题,请参考以下文章

java解析html是jsoup还是htmlparse还是其他的啥

JSoup——用Java解析html网页内容

Java中解析HTML数据 (利用第三方库Jsoup)

jsoup: Java HTML Parser

Java 爬虫工具Jsoup解析

java 使用jsoup处理html字符