celery

Posted achai222

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了celery相关的知识,希望对你有一定的参考价值。

celery

celery是一个异步任务框架,用于执行异步任务,执行延迟任务,执行定时任务

1 celery简介

1)可以不依赖任何服务器,通过自身命令,启动服务(内部支持socket)
2)celery服务为为其他项目服务提供异步解决任务需求的
注:会有两个服务同时运行,一个是项目服务,一个是celery服务,项目服务将需要异步处理的任务交给celery服务,celery就会在需要时异步完成项目的需求

人是一个独立运行的服务 | 医院也是一个独立运行的服务
	正常情况下,人可以完成所有健康情况的动作,不需要医院的参与;但当人生病时,就会被医院接收,解决人生病问题
	人生病的处理方案交给医院来解决,所有人不生病时,医院独立运行,人生病时,医院就来解决人生病的需求
	
	
	
	
# Celery is a project with minimal funding, so we don’t support Microsoft Windows. Please don’t open any issues related to that platform.
# celery是一个小组织的项目,所以没支持windows。

2 安装

pip install celery

3 celery的架构

Celery的架构由三部分组成,消息中间件(message broker)、任务执行单元(worker)和 任务执行结果存储(task result store)组成。

技术图片

消息中间件
Celery本身不提供消息服务,但是可以方便的和第三方提供的消息中间件集成。包括,RabbitMQ, Redis等等


任务执行单元
Worker是Celery提供的任务执行的单元,worker并发的运行在分布式的系统节点中。


任务结果存储
Task result store用来存储Worker执行的任务的结果,Celery支持以不同方式存储任务的结果,包括AMQP, redis等

4 celery的使用场景

异步执行:解决耗时任务,将耗时操作任务提交给Celery去异步执行,比如发送短信/邮件、消息推送、音视频处理等等

延迟执行:解决延迟任务

定时执行:解决周期(周期)任务,比如每天数据统计

5 celery的使用

celery可以通过两种不同的结构使用

推荐使用包结构

# 如果 Celery对象:Celery(...) 是放在一个模块下的
# 1)终端切换到该模块所在文件夹位置:scripts
# 2)执行启动worker的命令:celery worker -A 模块名 -l info -P eventlet
# 注:windows系统需要eventlet支持,Linux与MacOS直接执行:celery worker -A 模块名 -l info
# 注:模块名随意


# 如果 Celery对象:Celery(...) 是放在一个包下的
# 1)必须在这个包下建一个celery.py的文件,将Celery(...)产生对象的语句放在该文件中
# 2)执行启动worker的命令:celery worker -A 包名 -l info -P eventlet
# 注:windows系统需要eventlet支持,Linux与MacOS直接执行:celery worker -A 模块名 -l info
# 注:包名随意

5.1 基本结构+异步任务

project
    ├── celery_task  	# celery包
    │   ├── __init__.py # 包文件
    │   ├── celery.py   # celery连接和配置相关文件,且名字必须叫celery.py
    │   └── tasks.py    # 所有任务函数
    ├── add_task.py  	# 添加任务
    └── get_result.py   # 获取结果
# 基本结构提交异步任务


# 1 创建app与任务
# 写一个py文件,内容如下celery_task.py:
from celery import Celery
broker=‘redis://127.0.0.1:6379/1‘  #broker任务队列
backend=‘redis://127.0.0.1:6379/2‘   # 结构存储,执行完的结果存在这
# backend=‘redis://:123456@127.0.0.1:6379/1‘		密码:123456
# broker=‘redis://:123456@127.0.0.1:6379/2‘		密码:123456
app=Celery(__name__,broker=broker,backend=backend)

#添加任务(使用这个装饰器装饰,@app.task)
@app.task
def add(x,y):
    print(x,y)
    return x+y



# 2启动worker
    # 用命令来执行
    # 非windows
    # celery worker -A celery_task -l info
    
    # windows:需要安装eventlet模块
    # pip3 install eventlet
    # celery worker -A celery_task -l info -P eventlet
        
        
        
# 3 添加任务
	from celery_task import add
    # 函数有delay方法是由于装饰器
    ret=add.delay(5,4)  # 向broker中添加一个任务
    print(ret)		# 返回值ret为任务的uuid号
    
    
    
# 4 查看任务的执行结果
	from celery_task import app
    from celery.result import AsyncResult
    id = ‘3e397fd7-e0c1-4c5c-999c-2655a96793bb‘
    if __name__ == ‘__main__‘:
        async = AsyncResult(id=id, app=app)
        if async.successful():
            result = async.get()
            print(result)
        elif async.failed():
            print(‘任务失败‘)
        elif async.status == ‘PENDING‘:
            print(‘任务等待中被执行‘)
        elif async.status == ‘RETRY‘:
            print(‘任务异常后正在重试‘)
        elif async.status == ‘STARTED‘:
            print(‘任务已经开始被执行‘)

5.2 包结构+延时任务

注意点:必须创建名为celery.py的文件

# 包结构提交延时任务

#1 新建一个包,叫celery_task
    -celery_task
        -__init__.py
        -celery.py
        -task1.py
        -task2.py
        
        
        
# 2 celery.py
    from celery import Celery
    broker=‘redis://127.0.0.1:6379/1‘  # broker任务队列
    backend=‘redis://127.0.0.1:6379/2‘	# 结构存储,执行完的结果存在这
    app=Celery(__name__,broker=broker,backend=backend,include=[‘celery_task.task1‘,‘celery_task.task2‘])
    
    
    
# 3 task1.py
    from .celery import app
    @app.task
    def add(x,y):
        print(x,y)
        return x+y
    
    
    
# 4 task2.py
	from .celery import app
    @app.task
    def mutile(x,y):
        print(x,y)
        return x*y
    
    
    
    
# 5 添加任务(异步任务,延迟任务)
    from celery_task.task1 import add
    from celery_task.task2 import mutile
    #  提交异步
    ret=add.delay(6,7)
    print(ret)  # 2d4ad592-9548-4c7c-8df4-7f8583e8a1b1
    
    # 提交延迟任务
    from datetime import datetime, timedelta
    # 需要utc时间
    eta=datetime.utcnow() + timedelta(seconds=10)
    ret=add.apply_async(args=(240, 50), eta=eta)
    print(ret)

    

# 6 查看任务的执行结果
	from celery_task import app
    from celery.result import AsyncResult
    id = ‘3e397fd7-e0c1-4c5c-999c-2655a96793bb‘
    if __name__ == ‘__main__‘:
        async = AsyncResult(id=id, app=app)
        if async.successful():
            result = async.get()
            print(result)
        elif async.failed():
            print(‘任务失败‘)
        elif async.status == ‘PENDING‘:
            print(‘任务等待中被执行‘)
        elif async.status == ‘RETRY‘:
            print(‘任务异常后正在重试‘)
        elif async.status == ‘STARTED‘:
            print(‘任务已经开始被执行‘)

5.3 异步任务

ret=add.delay(6,7)
print(ret)  # 2d4ad592-9548-4c7c-8df4-7f8583e8a1b1

5.4 延时任务

eta=datetime.utcnow() + timedelta(seconds=10)
ret=add.apply_async(args=(240, 50), eta=eta)
print(ret)

5.5 定时任务

#1 celery.py
from celery import Celery
broker=‘redis://127.0.0.1:6379/1‘  # broker任务队列
backend=‘redis://127.0.0.1:6379/2‘   # 结构存储,执行完的结果存在这
app=Celery(__name__,broker=broker,backend=backend,include=[‘celery_task.task1‘,‘celery_task.task2‘])


# 执行定时任务
app.conf.timezone = ‘Asia/Shanghai‘		# 时区
app.conf.enable_utc = False		# 是否使用UTC


# 任务的定时配置
from datetime import timedelta
from celery.schedules import crontab
app.conf.beat_schedule = {
    ‘add-task‘: {
        ‘task‘: ‘celery_task.task1.add‘,
        # ‘schedule‘: timedelta(seconds=3),
        ‘schedule‘: crontab(hour=8, day_of_week=1),  # 每周一早八点
        ‘args‘: (300, 150),
    }
}
    
    
    
# 2 启动worker,启动beat
	-celery worker -A celery_task -l info -P eventlet
	-celery beat -A celery_task -l info

6 django使用celery

celery.py

"""
celery框架django项目工作流程
1)加载django配置环境
2)创建Celery框架对象app,配置broker和backend,得到的app就是worker
3)给worker对应的app添加可处理的任务函数,用include配置给worker的app
4)完成提供的任务的定时配置app.conf.beat_schedule
5)启动celery服务,运行worker,执行任务
6)启动beat服务,运行beat,添加任务

重点:由于采用了django的反射机制,使用celery.py所在的celery_task包必须放置项目的根目录下
"""

# 一、加载django配置环境
import os
os.environ.setdefault("DJANGO_SETTINGS_MODULE", "luffyapi.settings.dev")

# 二、加载celery配置环境
from celery import Celery
# broker
broker = ‘redis://127.0.0.1:6379/0‘
# backend
backend = ‘redis://127.0.0.1:6379/1‘
# worker
app = Celery(broker=broker, backend=backend, include=[‘celery_task.tasks‘])


# 时区
app.conf.timezone = ‘Asia/Shanghai‘
# 是否使用UTC
app.conf.enable_utc = False

# 任务的定时配置
from datetime import timedelta
from celery.schedules import crontab
app.conf.beat_schedule = {
    ‘update-banner-list‘: {
        ‘task‘: ‘celery_task.tasks.update_banner_list‘,
        ‘schedule‘: timedelta(seconds=10),
        ‘args‘: (),
    }
}

tasks.py

from .celery import app
from django.core.cache import cache
from home import models, serializers
from django.conf import settings


@app.task
def update_banner_list():
    queryset = models.Banner.objects.filter(is_delete=False, is_show=True).order_by(‘-orders‘)[:settings.BANNER_COUNT]
    banner_list = serializers.BannerSerializer(queryset, many=True).data
    # 拿不到request对象,所以头像的连接base_url要自己组装
    for banner in banner_list:
        banner[‘image‘] = ‘http://127.0.0.1:8000%s‘ % banner[‘image‘]

    cache.set(‘banner_list‘, banner_list, 86400)
    return True

以上是关于celery的主要内容,如果未能解决你的问题,请参考以下文章

Celery实现定时任务crontab

Celery架构

Python / Celery:杀死父任务时如何杀死子任务?

我如何在 API 和工作人员中使用具有不同代码库的 celery

Celery+Rabbitmq实现异步任务

在 Celery 中使用 Python 标准日志记录