Splash 简介与安装

Posted pzk7788

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Splash 简介与安装相关的知识,希望对你有一定的参考价值。

Splash 说白了就是一个轻量级的浏览器,利用它,我们同样可以实现跟其他浏览器一样的操作,我们使用 Docker 来安装 Splash:

[[email protected] ~]# docker run -d -p 8050:8050 scrapinghub/splash    //安装 Splash 并在后台运行
[[email protected] ~]# pip3 install scrapy-splash                       //安装 scrapy-splash 库,以便 Python 操作 Splash

安装好之后,可以通过 http://localhost:8050 访问其 Web 界面,如下,我们可以通过输入 https://www.baidu.com/,然后点击 Render me!来访问指定的页面

访问的页面,实际上是通过下面的 Lua 脚本渲染出来的,如下脚本中,先调用 go() 方法去加载页面,然后调用 wait() 方法等待了一定时间,最后返回了页面的源码、截图和 HAR 信息

因此,我们大体了解了 Splash 是通过 Lua 脚本来控制了页面的加载过程的,加载过程完全模拟浏览器,最后可返回各种格式的结果,如网页源码和截图等。

技术图片

技术图片

 

 

 

 

 

    

 

     

以上是关于Splash 简介与安装的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(104):Splash基础(支持Lua的轻量级浏览器)

Scrapy中的splash的安装应用

使用 Splash

芝麻HTTP:Scrapy-Splash的安装

SpringCloud系列十一:SpringCloudStream(SpringCloudStream 简介创建消息生产者创建消息消费者自定义消息通道分组与持久化设置 RoutingKey)(代码片段

Splash对接Scrapy