scrapydweb:实现 Scrapyd 服务器集群监控和交互,Scrapy 日志分析和可视化

Posted my8100

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scrapydweb:实现 Scrapyd 服务器集群监控和交互,Scrapy 日志分析和可视化相关的知识,希望对你有一定的参考价值。

功能特性

  • Scrapyd 服务器集群监控和交互

    • 支持通过分组和过滤选中特定服务器节点
    • 一次点击,批量执行
  • Scrapy 日志分析

    • 统计信息展示
    • 爬虫进度可视化
    • 关键日志分类
  • 支持所有 Scrapyd API

    • Deploy project, Run Spider, Stop job
    • List projects/versions/spiders/running_jobs
    • Delete version/project

GitHub

scrapydweb

欢迎 Star 和提交 Issue

安装

通过 pip 安装:

pip install scrapydweb

启动

通过命令行终端运行 "scrapydweb -h" 以查看帮助和选项. 第一次运行将在当前工作目录生成配置文件 "scrapydweb_settings.py",可用于自定义 Scrapyd 服务器列表等选项.

scrapydweb

 

通过浏览器访问 http://127.0.0.1:5000

运行界面截图

  • 集群监控和交互

    技术分享图片 

  • 当前节点任务列表

    技术分享图片

     

  • 日志分析

    • 统计信息输出

      技术分享图片

       

    • 爬虫进度可视化

      技术分享图片

       

    • 关键日志分类

      技术分享图片

       

  • 部署项目

    技术分享图片

     

  • 运行爬虫

    技术分享图片

     

  • 管理项目

    技术分享图片

 







以上是关于scrapydweb:实现 Scrapyd 服务器集群监控和交互,Scrapy 日志分析和可视化的主要内容,如果未能解决你的问题,请参考以下文章

如何通过 Scrapyd + ScrapydWeb 简单高效地部署和监控分布式爬虫项目

LogParser v0.8.0 发布:一个用于定期增量式解析 Scrapy 爬虫日志的 Python 库,配合 ScrapydWeb 使用可实现爬虫进度可视化

scrapydWeb安装和使用

scrapydweb 安装部署

分布式爬虫的部署之Scrapyd对接Docker

scrapyd打包到服务器运行