Pyspider

Posted 2022-06-18 q240756200

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Pyspider相关的知识，希望对你有一定的参考价值。

Pyspider是由国人(binux)编写的强大的网络爬虫系统

Ptspider带有强大的WebUi / 脚本编辑器 / 任务监控器 / 项目管理器以及结果处理器。他支持多种数据库后端 / 多种消息队列 / javascript 渲染页面爬去。使用起来非常方便

基本功能

Pyspider 提供了 WebUi ，爬虫编写 / 调试都是在WebUi 中进行的。
Scrapy原生是不具备这个功能的，他采用的代码和命令行的操作，但是可以通过对接Portia 实现可视化配置

Pyspider 调试非常便捷，WebUi 操作便捷直观
Scrapy 是使用parse 命令进行调试，方便程度不及Pyspider

Pyspider 支持PhantomJS 来进行Javascript 渲染页面的采集。
Scrapy 可以对接Scrapy-Splash组件实现，不过需要额外的配置

Pyspider 中内置了pyquery 作为选择器
Scrapy 对接了 Xpath / CSS 选择器和正则

Pyspider 的可扩展程度不足，可配置化程度不高。
Scrapy 可以通过对接Middleware / Pipelinc / Extension 等组件来实现非常强大的功能。模块之间的耦合度低，可扩展性高

以上是关于Pyspider的主要内容，如果未能解决你的问题，请参考以下文章