Ubuntu16.04Scrapy爬虫定时任务

Posted 想54256

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Ubuntu16.04Scrapy爬虫定时任务相关的知识,希望对你有一定的参考价值。

1、书写shell脚本

#!/bin/sh

# 爬虫的目录
cd /home/x5456/SinaSpider
# scrapy要使用绝对路径(不知道的话用which scrapy命令获取)
/home/x5456/.local/bin/scrapy crawl sina(爬虫名)

2、使用crontab -e命令去编辑定时任务(第一次会让你选择使用的编辑器,最好选nano;如果选错了使用select-editor 命令重新选一下)

在下面填一行

41 16 * * * /home/x5456/SinaSpider/sinastart.sh  # 每天16点41分执行一次这个脚本

3、重启定时任务的服务(好像不重启也行)

sudo service cron restart

 

以上是关于Ubuntu16.04Scrapy爬虫定时任务的主要内容,如果未能解决你的问题,请参考以下文章

Ubuntu16.04下Scrapy环境的搭建

Ubuntu 16.04设置定时任务

ubuntu 16.04 周期定时任务 crontab 的 使用

爬虫在部署到定时任务是发生的问题

python实现scrapy定时执行爬虫

scrapy相关整理