怎么用python爬虫爬取可以加载更多的网页

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么用python爬虫爬取可以加载更多的网页相关的知识,希望对你有一定的参考价值。

就像百度图片,当加载了更多图片之后网页源码却没有发生变化,多加载的图片也不能爬取下来,这种情况该怎么处理?

参考技术A 这种情况我自己还没有试过,只是借助爬虫框架pyspider结合PhantomJS,这样就可以在python里面嵌入一些js代码,实现点击,下拉等操作啦。本回答被提问者采纳

爬虫中怎样用扒出来的链接扒网页中的内容?

我们在浏览器地址栏输入一个网址并按回车,就会打开一个页面,同样,爬虫是通过每一个网址打开页面并收集页面中的信息,通常我们在写网络爬虫时需要指定一个起始网址,爬虫通过请求该起始网址获得浏览器给出的响应,响应中包含页面上的所有内容,爬虫分析页面内容进行信息收集,这个过程可以通过采集器或手写爬虫实现。望采纳 参考技术A 网页上的数据的话可以用采集器工具去采集。不同的工具也有对应的使用教程

以上是关于怎么用python爬虫爬取可以加载更多的网页的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫怎么爬取webpack打包过页面的

python爬取MM图片

自己写了一个爬虫,求教如何在网页上爬取动态加载的信息。

如何利用python爬取网页内容

爬虫中怎样用扒出来的链接扒网页中的内容?

如何用JAVA爬取AJAX加载后的页面