Scrapy-自定制scrapy命令

Posted benchdog

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Scrapy-自定制scrapy命令相关的知识,希望对你有一定的参考价值。

  • 在spiders同级创建任意目录,如:commands
  • 在其中创建 crawlall.py 文件 (此处文件名就是自定义的命令)
from scrapy.commands import ScrapyCommand
    from scrapy.utils.project import get_project_settings


    class Command(ScrapyCommand):

        requires_project = True

        def syntax(self):
            return [options]

        def short_desc(self):
            return Runs all of the spiders

        def run(self, args, opts):
            spider_list = self.crawler_process.spiders.list()
            for name in spider_list:
                self.crawler_process.crawl(name, **opts.__dict__)
            self.crawler_process.start()

crawlall.py
  • 在settings.py 中添加配置 COMMANDS_MODULE = ‘项目名称.目录名称‘
  • 在项目目录执行命令:scrapy crawlall

以上是关于Scrapy-自定制scrapy命令的主要内容,如果未能解决你的问题,请参考以下文章

scrapy框架自定制命令

Scrapy-自定制scrapy命令

Scrapy定制命令

你知道在 scrapy 中,可以定制化导出数据格式吗?scrapy 导出器学习

Scrapy 框架 中间件,信号,定制命令

scrapy主动退出爬虫的代码片段(python3)