怎么用python爬虫爬取可以加载更多的网页

Posted 2023-04-02

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了怎么用python爬虫爬取可以加载更多的网页相关的知识，希望对你有一定的参考价值。

就像百度图片,当加载了更多图片之后网页源码却没有发生变化,多加载的图片也不能爬取下来,这种情况该怎么处理?

参考技术A 这种情况我自己还没有试过，只是借助爬虫框架pyspider结合PhantomJS，这样就可以在python里面嵌入一些js代码，实现点击，下拉等操作啦。本回答被提问者采纳

爬虫中怎样用扒出来的链接扒网页中的内容？

我们在浏览器地址栏输入一个网址并按回车，就会打开一个页面，同样，爬虫是通过每一个网址打开页面并收集页面中的信息，通常我们在写网络爬虫时需要指定一个起始网址，爬虫通过请求该起始网址获得浏览器给出的响应，响应中包含页面上的所有内容，爬虫分析页面内容进行信息收集，这个过程可以通过采集器或手写爬虫实现。望采纳参考技术A 网页上的数据的话可以用采集器工具去采集。不同的工具也有对应的使用教程

以上是关于怎么用python爬虫爬取可以加载更多的网页的主要内容，如果未能解决你的问题，请参考以下文章

python爬虫怎么爬取webpack打包过页面的

python爬取MM图片

自己写了一个爬虫，求教如何在网页上爬取动态加载的信息。

如何利用python爬取网页内容

爬虫中怎样用扒出来的链接扒网页中的内容？

如何用JAVA爬取AJAX加载后的页面