抓网页01

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了抓网页01相关的知识,希望对你有一定的参考价值。

1、百度搜索“android 抓网页”,得到的结果:

  1.1、http://www.jianshu.com/p/7d658636764a    jsoup

  1.2、http://blog.sina.com.cn/s/blog_6b04c8eb01013v9n.html    HttpURLConnection

  1.3、http://www.crifan.com/android_how_to_crawl_website/    HttpClient 等等(较多较杂)

  1.4、http://www.2cto.com/kf/201409/333034.html    发现htmlparser这个开源库,但是发现和android提供的库有冲突,但其在纯java应用程序下是可行的。  然后是 jsoup

  1.5、http://blog.csdn.net/wf21cn/article/details/5503156    HttpURLConnection

  1.6、http://blog.csdn.net/laihuan99/article/details/9144227  要点:(1)使用Apache HttpClient库实现GET请求。(2)异步请求处理。(3)正则表达式抓取自己需要的数据。

  1.7、http://gqdy365.iteye.com/blog/2104046    htmlparser(ZC: 这篇文章里面没有提到 冲突的事情嘛...)

2、

  2.1、http://www.blogjava.net/rocky/archive/2013/08/07/jsoup.html    HTML Parser 替代品 jsoup

  2.2、http://www.daimami.com/HTML-CSS/195939.htm  运用 jsoup 对 HTML 文档进行解析和操作(比HTMLParser好)  jsoup 的过人之处――选择器

3、

 

以上是关于抓网页01的主要内容,如果未能解决你的问题,请参考以下文章

用html.parser抓网页中的超链接,返回list

用fiddler进行手机抓包,手机设置代理后手机浏览器无法打开网页

python爬虫抓网页的总结

python爬虫抓下来的网页,中间的中文乱码怎么解决

2-1 如何抓不同的接口(手机抓包,web网页抓包)

抓网页_面包网_java