celery+rabbitmq分布式消息队列的使用

Posted Python中文社区

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了celery+rabbitmq分布式消息队列的使用相关的知识,希望对你有一定的参考价值。

專 欄

当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 celery+rabbitmq分布式消息队列的使用 celery+rabbitmq分布式消息队列的使用

https://thief.one/




        之前在分布式消息队列上我一直使用rabbitmq+pika组合,然而由于对rabbitmq与pika理解不深,因此使用过程中遇到了很多坑。直到最近我决定重新研究下分布式消息队列,当然这次抛弃了pika,而选用celery。

  回想之前我对pika与celery有过一些疑问,两者有何区别?又有何相同点?经过几天的研究,目前总算是清晰了一点,因此在此对celery+rabbitmq做个记录。

安装celery

celery+rabbitmq分布式消息队列的使用

说明:celery只支持python2.7及以上版本,建议在虚拟环境中安装,如何构造虚拟环境可参考:python虚拟环境

Celery是如何工作的?

我在此模拟几个角色来解释下celery+rabbitmq是如何工作的,脑洞来自网络,这里借鉴扩展一番。

假设目前D公司要开半年度工作会议,会议上要指定下半年工作计划,参会人员有老板(下发任务者)、部门主管(celery分配任务者)、部门员工(工作者)、老板秘书(沟通协调者,rabbitmq)。

工作内容是什么?

  那么这场会议首先需要确定的是下半年的具体工作内容,这里就称之为“任务内容”。比如老板说我们下半年要开发出一个大数据平台,部门主管举手称赞,表示赞同,于是便愉快地定下了我们具体的工作任务(task),当然开发一个平台算是这个项目的总任务,其中可以细分成很多小的任务,比如大数据算法怎么写?界面怎么设计等。 
   
工作者在哪里?

  在确定了具体工作任务后,老板便把这个项目交给了部门主管(celery),而部门主管此时要确定谁去完成这项任务,它可以指定某个人(worker),也可以多个人。 
   
发布工作者在哪里?

  毫无疑问发布工作任务的人是老板(下发任务者),他指定了部门主管(celery)什么时候去完成哪些任务,并要求获取反馈信息。但有一点需要注意,老板只管布置任务,但不参与具体的任务分配,那这个任务分配的功能交给谁,没错就是部门主管,即celery。 
   
老板与员工如何沟通项目?

celery+rabbitmq分布式消息队列的使用

说明:celery_con.py的作用是连接rabbitmq,注意这里是利用celery连接的rabbitmq。映射到场景中,就是秘书与主管,秘书与老板之间传递信息的通道。

celery+rabbitmq分布式消息队列的使用

说明:task.py的功能是定制具体的任务,即“任务内容”,映射到场景中便是“开发一个大数据平台”,其中算法要怎么写?界面要如何设计等等。

celery(部门主管)

celery+rabbitmq分布式消息队列的使用

说明:此命令为开启work,分配任务;task就是task.py脚本的名称,表示work为task任务服务;-c 2表示同时开启2个work。映射到场景中,便是部门主管实时向秘书获取纸条,并分配给员工。

run.py(老板)

celery+rabbitmq分布式消息队列的使用

说明:run.py的作用是下发消息到rabbitmq队列中,映射到场景中即老板将任务写在纸条上交给秘书。

运行:

celery+rabbitmq分布式消息队列的使用

而这里的秘书指的就是rabbitmq。

celery与pika的区别

  简单来说,pika其实就是用来连接rabbitmq服务的一个python客户端模块,而rabbitmq本身只有消息存储功能,并没有任务的分配调度。当然在用pika连接rabbitmq的过程也可以任务分配,这需要利用pika模块自己写一个调度代码,也就是相当于自己写一个celery模块。 
  celery就是用来分配任务的,主要是做异步任务队列的,但是celery不具备存储的功能,因此需要一种介质去存储消息,所以常常与rabbitmq一起用。 
   
celery高级用法

celery+rabbitmq分布式消息队列的使用

并发下发任务

并发的下发任务,也可以使用for循环。这里指的并发,并不是所有任务一起执行,而是所有任务都下发到队列,而执行的并发数量,取决于work的数量。

celery+rabbitmq分布式消息队列的使用

指定下发的队列

有时候我们会遇到多个任务,而每个任务的执行对象不一样,因此需要创建不同的队列去存储任务,这时就需要我们在创建任务、消费任务时指定队列的名称。

配置celery

celery+rabbitmq分布式消息队列的使用

指定任务内容

celery+rabbitmq分布式消息队列的使用

下发任务

celery+rabbitmq分布式消息队列的使用

说明:下发任务时,将会把任务存入rabbitmq的test1队列中。

启动work处理任务

celery+rabbitmq分布式消息队列的使用

说明:worker工作者将会从rabbitmq的test1队列中获取数据。

更多celery的用法,可以参考:Celery - 分布式任务队列(请点击阅读原文)


长按扫描关注Python中文社区,

获取更多技术干货!

    

Python 中 文 社 区

Python中文开发者的精神家园

合作、投稿请联系微信:

pythonpost

— 人生苦短,我用Python —
1MEwnaxmMz7BPTYzBdj751DPyHWikNoeFS

以上是关于celery+rabbitmq分布式消息队列的使用的主要内容,如果未能解决你的问题,请参考以下文章

Celery + Flower + FastAPI + RabbitMQ ,Python实现异步消息队列和监控

Celery,Tornado,Supervisor构建和谐的分布式系统

Celery异步任务队列/周期任务+ RabbitMQ + Django

Celery 基本使用

Celery基本使用

在 MongoDb 中使用 MapReduce 与使用 Celery 和 RabbitMq 的分布式队列进行数据分析