Celery—分布式的异步任务处理系统
Posted dongxixi
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Celery—分布式的异步任务处理系统相关的知识,希望对你有一定的参考价值。
Celery
1.什么是Clelery
Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统
专注于实时处理的异步任务队列
同时也支持任务调度
Celery架构
消息中间件
Celery本身不提供消息服务,但是可以方便的和第三方提供的消息中间件集成。包括,RabbitMQ, Redis等等
任务执行单元
Worker是Celery提供的任务执行的单元,worker并发的运行在分布式的系统节点中。
任务结果存储
Task result store用来存储Worker执行的任务的结果,Celery支持以不同方式存储任务的结果,包括AMQP, redis等
Celery version 4.0 runs on Python ?2.7, 3.4, 3.5? PyPy ?5.4, 5.5? This is the last version to support Python 2.7, and from the next version (Celery 5.x) Python 3.5 or newer is required. If you’re running an older version of Python, you need to be running an older version of Celery: Python 2.6: Celery series 3.1 or earlier. Python 2.5: Celery series 3.0 or earlier. Python 2.4 was Celery series 2.2 or earlier. Celery is a project with minimal funding, so we don’t support Microsoft Windows. Please don’t open any issues related to that platform.
2.使用场景
异步任务:将耗时操作任务提交给Celery去异步执行,比如发送短信/邮件、消息推送、音视频处理等等
定时任务:定时执行某件事情,比如每天数据统计
3.Celery的安装配置
pip install celery
消息中间件:RabbitMQ/Redis
app=Celery(‘任务名‘,backend=‘xxx‘,broker=‘xxx‘)
4.Celery执行异步任务
# celery_task.py from celery import Celery # 不加密码 broker=‘redis://127.0.0.1:6379/0‘ # borker配置,任务队列 backend=‘redis://127.0.0.1:6379/1‘ # backend配置 执行结果存储
#加密码 # backend=‘redis://:[email protected]:6379/1‘ # broker=‘redis://:[email protected]:6379/2‘ #一定要指定一个名字
app=Celery(‘test‘,broker=broker,backend=backend) # 创建任务异步处理器 #任务其实就是个函数 #需要用一个装饰器 *.task装饰,表示该任务是被 * celery管理的,并且可以用celery执行的 @app.task def add(x,y): import time time.sleep(2) # 模拟阻塞任务 return x+y
这样我们就完成了上图流程中的三大配置,下面我们需要去提交任务并启动worker执行任务
另建add_task.py文件
#用于提交任务的py文件 import celery_task #提交任务到消息队列中 #只是把任务提交到消息队列中,并没有执行需要启动worker才可以生效 ret=celery_task.add.delay(3,4) # add 即celery_task中add函数 print(ret) # ret=a5ea035f-0cc3-44ba-b334-f5d7c7ce681d :任务的id号,待任务执行完毕,需要通过这个id去backend去取执行结果 #提交定时任务:于2019-07-20 11:13:56执行的任务,此任务只是在这里提交了,需要启动worker才可以生效 from datetime import datetime v1 = datetime(2019, 7, 20, 11, 13, 56) print(v1) # 时间对象 v2 = datetime.utcfromtimestamp(v1.timestamp()) print(v2) # #取出要执行任务的时间对象,调用apply_async方法,args是参数,eta是执行的时间 result = celery_task.add.apply_async(args=[1, 3], eta=v2) print(result.id) # 任务的id号,待任务执行完毕,需要通过这个id去backend去取执行结果 #第二种获取时间的方法 ctime = datetime.now() # 默认用utc时间 utc_ctime = datetime.utcfromtimestamp(ctime.timestamp()) from datetime import timedelta #取10s之后的时间对象 time_delay = timedelta(seconds=3) task_time = utc_ctime + time_delay # 时间对象的相加 result = celery_task.add.apply_async(args=[4, 3], eta=task_time) print(result.id)
启动worker
启动worker的两种方法:
# 方法一: from celery_task import app if __name__ == ‘__main__‘: app.worker_main() # cel.worker_main(argv=[‘--loglevel=info‘) # 方法二: # 命令行启动—常用 # linux下: celery worker -A celery_task_s1 -l info # windows下:celery worker -A celery_task_s1 -l info -P eventlet #eventlet是个模块 需要pip装下
接下来就是查看任务执行结果了
另起result.py文件
# 创建py文件:result.py,查看任务执行结果 from celery.result import AsyncResult from celery_task import app async = AsyncResult(id="e919d97d-2938-4d0f-9265-fd8237dc2aa3", app=cel) if async.successful(): result = async.get() print(result) # result.forget() # 将结果删除 elif async.failed(): print(‘执行失败‘) elif async.status == ‘PENDING‘: print(‘任务等待中被执行‘) elif async.status == ‘RETRY‘: print(‘任务异常后正在重试‘) elif async.status == ‘STARTED‘: print(‘任务已经开始被执行‘)
总结下Celery使用步骤:
创建celery_app_task.py,配置borker\\backend\\worker和任务函数
执行 add_task.py,添加任务,并获取任务ID
执行命令启动worker:celery worker -A celery_app_task -l info
执行 result.py,检查任务状态并获取结果
下面我们进入重点:
以上是关于Celery—分布式的异步任务处理系统的主要内容,如果未能解决你的问题,请参考以下文章