Python开发模块:Celery 分布式异步消息任务队列

Posted 朝阳的向日葵

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python开发模块:Celery 分布式异步消息任务队列相关的知识,希望对你有一定的参考价值。

前言:

Celery 是一个 基于python开发的分布式异步消息任务队列,通过它可以轻松的实现任务的异步处理, 如果你的业务场景中需要用到异步任务,就可以考虑使用celery, 举几个实例场景中可用的例子:

  • 你想对100台机器执行一条批量命令,可能会花很长时间 ,但你不想让你的程序等着结果返回,而是给你返回 一个任务ID,你过一段时间只需要拿着这个任务id就可以拿到任务执行结果, 在任务执行ing进行时,你可以继续做其它的事情。 
  • 你想做一个定时任务,比如每天检测一下你们所有客户的资料,如果发现今天 是客户的生日,就给他发个短信祝福

Celery有以下优点:

  • 简单:一单熟悉了celery的工作流程后,配置和使用还是比较简单的
  • 高可用:当任务执行失败或执行过程中发生连接中断,celery 会自动尝试重新执行任务
  • 快速:一个单进程的celery每分钟可处理上百万个任务
  • 灵活: 几乎celery的各个组件都可以被扩展及自定制

Celery基本工作流程图:

 

1、 Celery安装使用

Celery需要在linux的环境下运行:

1
2
3
4
5
6
# 安装
[root@localhost celerys]# pip3 install celery
 
# 进入python import无异常表示安装成功
[root@localhost celerys]# python3
>>> import celery

Celery的默认broker是RabbitMQ, 仅需配置一行就可以

1
broker_url = \'amqp://guest:guest@localhost:5672//\'

使用Redis做broker也可以

1
2
broker_url = \'redis://localhost:6379/0\'
#redis://:password@hostname:port/db_number

 

2、简单使用

创建一个任务文件就叫tasks.py:

1
2
3
4
5
6
7
8
9
10
11
12
from celery import Celery
import time
 
app = Celery(\'cly\',                                        # 任意
             broker=\'redis://192.168.1.166:6379/0\',        # 中间件
             backend=\'redis://localhost\')                  # 数据存储
  
@app.task
def add(x,y):
    time.sleep(10)
    print("running...",x,y)
    return x+y

启动Celery Worker来开始监听并执行任务:

1
2
3
4
5
# 加入环境变量
[root@localhost ~]# PATH=$PATH:/usr/local/python3.5/bin/
 
# 启动一个worker
[root@localhost celerys]# celery -A tasks worker --loglevel=info

调用任务:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
[root@localhost celerys]# python3
Python 3.5.2 (default, Jul  7 201723:36:01)
[GCC 4.8.5 20150623 (Red Hat 4.8.5-11)] on linux
Type "help""copyright""credits" or "license" for more information.
>>> from tasks import add                   # import add
>>> add.delay(4,6)                          # 执行函数
<AsyncResult: 4b5a8ab6-693c-4ce5-b779-305cfcdf70cd>   # 返回taskid
>>> result = add.delay(4,6)                 # 执行函数
>>> result.get()                            # 同步获取结果,一直等待
10
 
>>> result.get(timeout=1)                   # 设置超时时间,过期错误异常
Traceback (most recent call last):
    --strip--
celery.exceptions.TimeoutError: The operation timed out.
 
>>> result = add.delay(4,\'a\')               # 执行错误命令
>>> result.get()                            # get后获取到错误信息,触发异常
Traceback (most recent call last):
     --strip--
celery.backends.base.TypeError: unsupported operand type(s) for +\'int\' and \'str\'
>>> result = add.delay(4,\'a\')
>>> result.get(propagate=False)             # propagate=False 不触发异常,获取错误信息
TypeError("unsupported operand type(s) for +: \'int\' and \'str\'",)
>>> result.traceback                        # 获取具体错误信息 log打印用
\'Traceback (most recent call last):\\n  File "/usr/local/python3.5/lib/python3.5/site-packages/celery/app/trace.py", line 367, in trace_task\\n    R = retval = fun(*args, **kwargs)\\n  File "/usr/local/python3.5/lib/python3.5/site-packages/celery/app/trace.py", line 622, in __protected_call__\\n    return self.run(*args, **kwargs)\\n  File "/data/celerys/tasks.py", line 12, in add\\n    return x+y\\nTypeError: unsupported operand type(s) for +: \\\'int\\\' and \\\'str\\\'\\n\'

此时worker端收到的信息:

1
2
3
4
[2017-07-08 03:12:22,565: WARNING/PoolWorker-1] running...     # 获取到任务
[2017-07-08 03:12:22,565: WARNING/PoolWorker-14
[2017-07-08 03:12:22,565: WARNING/PoolWorker-16              # 任务执行完毕数据存储到backend端
[2017-07-08 03:12:22,567: INFO/PoolWorker-1] Task tasks.add[683e395e-48b9-4d32-b3bb-1492c62af393] succeeded in 10.01260852499945s10

查看broker(即192.168.1.166)端数据:

1
2
3
4
5
6
[root@localhost redis-3.0.6]# src/redis-cli
127.0.0.1:6379> keys *
1"_kombu.binding.celeryev"
2"unacked_mutex"
3"_kombu.binding.celery.pidbox"
4"_kombu.binding.celery"

执行完后,backend端的数据:

1
2
3
[root@localhost redis-3.0.6]# src/redis-cli   # 程序get后,数据未被删除
127.0.0.1:6379> keys *
1"celery-task-meta-683e395e-48b9-4d32-b3bb-1492c62af393"

 

以上是关于Python开发模块:Celery 分布式异步消息任务队列的主要内容,如果未能解决你的问题,请参考以下文章

python—Celery异步分布式

python—Celery异步分布式

python之celery队列模块

Celery异步的分布式任务调度理解

python celery 模块

python任务调度模块celery