基于Django与Celery实现异步对列任务 - Python - 伯乐在线 http://python.jobbole.com/81953/ 更新于2015-08-26
注:本文根据官方文档结合具体例子整理,供celery入门学习,更多内容请移步参考资料一节。最近更新于2014-10-19
1 什么是celery
celery是一个异步任务队列/基于分布式消息传递的作业队列。Celery通过消息(message)进行通信,使用代理(broker)在客户端和工作执行者之间进行交互。当开始一个任务时,客户端发送消息到队列并由代理将其发往响应的工作执行者处。
2 Windows环境配置
在这里使用RabbitMQ作为消息代理(broker),Django数据库作为结果存储(ResultStore)。
2.1 安装ERLang
首先是到ERLang官网去下载ERlang可执行文件 地址:http://www.erlang.org/download.html
然后安装ERLang。
然后设置ERLang的环境变量。
在环境变量中加入 ERL_HOME = erlang安装目录
在path中添加 %ERL_HOME%\bin
2.2 安装rabbitmq
从http://www.rabbitmq.com/releases/rabbitmq-server/v3.1.5/rabbitmq-server-3.1.5.exe下载rabbitmq-server 并安装。
点击开始菜单中的 rabbitmq-start ,rabbitmq-server就启动了,在管理工具-服务中可以看到相关信息的。
2.3 安装djcelery
和大多数Python第三方包一样,用 pip安装celery和djcelery两个包。djcelery依赖于djcelery,所以只要执行pip install djcelery命令即可。
3 配置Djcelery
主要步骤
在settings配置相关参数
定义任务
执行任务,可以在程序中调用执行,也可交给后台周期性执行
3.1 基本配置
下面是djcelery的有关配置,定义在Django项目的settings模块内。
#... ...
INSTALLED_APPS = (
'django.contrib.auth',
'django.contrib.contenttypes',
'django.contrib.sessions',
'django.contrib.sites',
'django.contrib.messages',
'django.contrib.staticfiles',
# Uncomment the next line to enable the admin:
'django.contrib.admin',
# Uncomment the next line to enable admin documentation:
# 'django.contrib.admindocs',
'djcelery', #添加djcelery
'mrs_app', #自己的APP
)
# ... ....
# 配置djcelery相关参数,ResultStore默认存储在数据库可不必重写 ,
import djcelery
djcelery.setup_loader()
BROKER_URL = 'amqp://guest:guest@localhost:5672//'
#任务定义所在的模块
CELERY_IMPORTS = ('mrs_app.my_celery.tasks', )
# 使用和Django一样的时区
CELERY_TIMEZONE = TIME_ZONE
#以上为基本配置,以下为周期性任务定义,以celerybeat_开头的
CELERYBEAT_SCHEDULER = 'djcelery.schedulers.DatabaseScheduler'
#CELERYBEAT_SCHEDULE = {
# 'add-every-3-minutes': {
# 'task': 'mrs_app.my_celery.tasks.monthly_reading_task',
# 'schedule': timedelta(minutes=3)
# },
#}
首先导出djcelery模块,并调用setup_loader方法加载有关配置。
broker_url | 类URL格式表明使用哪种消息代理 | 格式参见这里 |
celery_imports | 任务定义在哪个模块,最好以tasks.py命名 | |
celery_timezone | 时间时区,等于TIMEZONE即和Django一样的时区。 | |
celerybeat_scheduler | 周期性任务,用Django数据库保存最后运行时间等信息 | |
celerybeat_schedule | 定义任务,上面注释表示每隔3分钟执行monthly_reading_task任务 |
3.2 定义任务
有两种格式
类定义:一个继承了celery.app.task的类并实现了run方法
函数定义:@task装饰的函数
通过实现task相关方法可以实现更多的逻辑,比如成功回调、错误处理、重试机制等,以下是最基本的定义方式。
#mrs_app.my_celery.tasks.py
from celery import task
#第一种,函数方式
@task(name='monthly_reading')
def monthly_reading_task():
task_obj = MonthlyReading(debug=False)
task_obj.start()
#第二种,类定义
class MonthlyReadingTask(Task):
name='monthly_reading'
def run(*args, **kwargs):
task_obj = MonthlyReading(debug=False)
task_obj.start()
3.3 启动
启动 python manage.py celery worker -l info
如果有定时任务的话,还需要启动心跳
另开一个cmd窗口 python manage.py celery beat (windows下-B选项不可用)
4 执行任务
4.1 直接调用
自己在代码中的调用,支持延迟/同步/异步调用,可参考task类定义,例子见参考资料的《使用django+celery+RabbitMQ实现异步执行》。
4.2 周期性调用
这种由djcelery调用,所以需要在settings.CELERYBEAT_SCHEDULER设置一个调度器,这里使用数据库。
djcelery提供了一些Model(定义在djcelery/models.py文件),数据库模型如下,
periodictask | 描述定时任务。重要字段有: name: 字符串,标识符 task,字符串,任务函数/类所在的路径,一般是celery_imports + function name。 interval:外键指向intervalschedule,表示每隔多少时间执行 crontab:外键指向crontabschedule,表示在某一时刻执行。 enabled:是否生效 |
|
intervalschedule | 表示时间间隔,有两个参数: every:正数;period间隔单位。比如intervalschedule(every=2, period='day')表示每隔2天 |
|
crontabschedule | 表示某一时刻,有minute、hour、day_of-week、day_of_month、day_of_year它们的组合意义,参见cron时间表示法,比如0 0 * 10 * 表示每个月的10号凌晨。 |
说明:
任务和定时任务的区别:定时任务 = 任务 + intervalschedule/crontabschedule 。两个定时任务可以执行同一个任务。
任务没有相应的Model,用字符串表示,即periodictask模型的task字段
定时任务有相应的Model即periodictask。
djcelery在初始化中主要完成两件:
在settings.CELERY_IMPORTS定义下的模块搜索所有任务。这个对数据库没有任何改变,只是用Admin添加定时任务时periodictask.task字段变成选择框,列出了所有定义的任务。
从settings.CELERYBEAT_SCHEDULE创建定时任务,这个会创建数据记录,相当于celery_models.PeriodicTask.objects.create(..)语句。
4.3 创建定时任务
通过它提供的Model Query API来操作,同平常的数据库查询一样。
from djcelery import models as celery_models
celery_models.PeriodicTask.objects.create(...)
celery_models.PeriodicTask.ojects.get(name='add')
....
djcelery提供了admin管理界面,访问http://localhost:8000/admin/djcelery/ 即可,在这里可以对定时任务进行增删改查,具体和Django admin一样。
(图待补充)
注:当我们修改任务的设置后,比如关闭、更改时间后不用重启celery服务等。
4.4 示例
admin毕竟是给后台管理人员使用的,它所有的参数都暴露给使用者了。下面是一个实际使用的例子。
需求:ajax实现月度定时任务monthly_reading_task的执行和控制,即
每个月的某一天执行该任务;可以选择开启或者关闭该定时任务;能够选择任务在哪一天(1-28日)执行。
界面看起来是这样的:
基本上就是Model的增删改查。就不是通过admin来操作了。
查询任务信息
def read(self, request, *args, **kwargs):
try:
task = celery_models.PeriodicTask.objects.get(name=self.TASK_NAME)
if task.enabled:
return {
'enabled': True,
'day_of_month': int(task.crontab.day_of_month),
'last_run_at': task.last_run_at if task.last_run_at else '0'
}
else:
return {'enabled': False}
except celery_models.PeriodicTask.DoesNotExist:
return {'enabled': False}
更新日期
def create(self, request, *args, **kwargs):
enabled = request.POST.get('enabled', None)
if enabled not in [self.ENABLED_POST_VALUE, self.DISABLED_POST_VALUE]:
return self.operate_fail('无效参数')
if enabled == self.DISABLED_POST_VALUE:
self.disable_task(self.TASK_NAME)
return self.operate_success()
else:
try:
day_of_month = int(request.POST.get('day_of_month', ''))
if day_of_month > 28 or day_of_month < 1:
return self.operate_fail('日期必须在1-28日之间')
task, created = celery_models.PeriodicTask.objects.get_or_create(name="monthly_reading",
task="mrs_app.my_celery.tasks.monthly_reading_task")
if created:
crontab = celery_models.CrontabSchedule.objects.create(day_of_month=day_of_month,
hour=0,
minute=0)
crontab.save()
task.crontab = crontab
task.enabled = True
task.save()
else:
task.crontab.day_of_month = day_of_month
task.crontab.save()
task.enabled = True
task.save()
return self.operate_success()
except ValueError:
return self.operate_fail('抄表日不能为空')
关闭定时
def disable_task(self, name):
try:
task = celery_models.PeriodicTask.objects.get(name=name)
task.enabled = False
task.save()
return True
except celery_models.PeriodicTask.DoesNotExist:
return True
后台控制界面
5 参考资料&进阶
官方文档:http://docs.celeryproject.org/en/latest/django/first-steps-with-django.html
cron时间格式:http://www.nncron.ru/help/EN/working/cron-format.htm
celery最佳实践:http://my.oschina.net/siddontang/blog/284107
使用django+celery+RabbitMQ实现异步执行:http://blog.charlee.li/django-celery-rabbitmq-intro/
RabbitMQ文档: http://www.rabbitmq.com/documentation.html
Django/Celery Quickstart (or, how I learned to stop using cron and love celery) http://chase-seibert.github.io/blog/2010/07/09/djangocelery-quickstart-or-how-i-learned-to-stop-using-cron-and-love-celery.html
Using Celery to handle asynchronous tasks in Django – Sebastian Dahlgren http://sebastiandahlgren.se/2012/11/13/using-celery-for-asynchronous-messages-in-django/
Django-celery配置及使用指南 http://zhujinliang.cn/django/2013/07/18/Django-celery%E9%85%8D%E7%BD%AE%E5%8F%8A%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97/
Introducing Celery for Python+Django - LINUX For You http://www.opensourceforu.com/2013/12/introducing-celery-pythondjango/
Django中如何使用django-celery完成异步任务 (1) | 上海味股达信息科技有限公司 http://www.weiguda.com/blog/73/
Django Celery Architecture | langoor.mobi Blog http://blog.langoor.mobi/django-celery-redis-vs-rabbitmq-message-broker/django_celery_architecture/
Queueing Messages using Celery with RabbitMQ Message Broker Server - 2014 http://www.bogotobogo.com/python/RabbitMQ_Celery/python_Queueing%20using_Celery_with_RabbitMQ_Message_Broker_Server.php
AMQP, RabbitMQ and Celery - A Visual Guide For Dummies | Abhishek Tiwari http://abhishek-tiwari.com/post/amqp-rabbitmq-and-celery-a-visual-guide-for-dummies
Tracing Celery Performance For Web Applications - 推酷 http://www.tuicool.com/articles/ZbyUnu
来源:oschina
链接:https://my.oschina.net/u/995588/blog/292395