抓网页__第3方库选择_01

Posted JavaSkill

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了抓网页__第3方库选择_01相关的知识,希望对你有一定的参考价值。

1、百度搜索“android 抓网页”,得到的结果:

  1.1、http://www.jianshu.com/p/7d658636764a    jsoup

  1.2、http://blog.sina.com.cn/s/blog_6b04c8eb01013v9n.html    HttpURLConnection

  1.3、http://www.crifan.com/android_how_to_crawl_website/    HttpClient 等等(较多较杂)

  1.4、http://www.2cto.com/kf/201409/333034.html    发现htmlparser这个开源库,但是发现和android提供的库有冲突,但其在纯java应用程序下是可行的。  然后是 jsoup

  1.5、http://blog.csdn.net/wf21cn/article/details/5503156    HttpURLConnection

  1.6、http://blog.csdn.net/laihuan99/article/details/9144227  要点:(1)使用Apache HttpClient库实现GET请求。(2)异步请求处理。(3)正则表达式抓取自己需要的数据。

  1.7、http://gqdy365.iteye.com/blog/2104046    htmlparser(ZC: 这篇文章里面没有提到 冲突的事情嘛...)

2、

  2.1、http://www.blogjava.net/rocky/archive/2013/08/07/jsoup.html    HTML Parser 替代品 jsoup

  2.2、http://www.daimami.com/HTML-CSS/195939.htm  运用 jsoup 对 HTML 文档进行解析和操作(比HTMLParser好)  jsoup 的过人之处――选择器

3、ZC

  综合考虑下来,暂时使用 jsoup

4、

5、

以上是关于抓网页__第3方库选择_01的主要内容,如果未能解决你的问题,请参考以下文章

抓网页01

用html.parser抓网页中的超链接,返回list

__x__0905第二天__网页三大组成部分

Charles手机抓包设置&无法打开火狐网页设置

02_书写第一个html网页

抓jsoup_02_数据